
Machine Learning Engineer (NLP) Job at US Company in San Francisco
US Company, San Francisco, CA, United States
Tonic.ai is looking for a hands-on Machine Learning Engineer to help build production-grade NLP systems that power our data privacy and information extraction products. You'll join a small, experienced team working at the intersection of LLMs, data privacy, and applied AI — developing and fine-tuning models that detect and redact sensitive information across diverse datasets.
What You’ll Do
- Build and ship models. Fine-tune and evaluate transformer-based models (e.g., RoBERTa, Gemma, LLaMA) to support PII redaction, entity extraction, and synthetic data generation.
- Own the ML lifecycle. From dataset curation and experiment tracking to model deployment and monitoring — you’ll own the full path from prototype to production.
- Collaborate cross-functionally. Partner with Product and Design to shape how ML models drive user-facing features, and work with the broader engineering team to integrate them into scalable systems.
- Experiment responsibly. Document your experiments, evaluate results rigorously, and help push the frontier of safe and explainable AI for data privacy.
What You’ll Bring
- 3+ years of professional experience in applied ML or data science with a focus on NLP
- Proficiency in Python and deep learning frameworks such as PyTorch and Hugging Face Transformers
- Hands-on experience with experiment tracking (e.g., Weights & Biases), distributed training (e.g., Accelerate), and model serving (e.g., vLLM)
- Comfort working independently and iterating quickly — you enjoy the mix of research, engineering, and product thinking
- Strong communication and collaboration skills
Bonus Points For:
- Experience with supervised and reinforcement learning fine-tuning (e.g. TRL)
- Familiarity with data privacy, PII redaction, or healthcare data
- A public portfolio, blog, or open-source contributions that demonstrate your technical depth and curiosity
Why You’ll Love It Here
- High autonomy and meaningful ownership — your models will ship to production, not sit in a notebook
- Small, collaborative team with deep expertise in NLP and privacy
- Opportunity to work with real-world, high-impact data in domains like healthcare and financial services
About Tonic.ai
Tonic.ai empowers developers while protecting customer privacy by enabling companies to create safe, synthetic versions of their data for use in software development, model training, and AI implementation. Founded in 2018, with offices in San Francisco, Atlanta, New York, and London, the company is pioneering enterprise tools for data transformation, de-identification, synthesis, and subsetting, in pursuit of its mission to make data usable. Thousands of developers use data generated with Tonic.ai on a daily basis to build their products faster in industries as wide ranging as healthcare, financial services, logistics, edtech, and e-commerce. Working with customers like eBay, Cigna, American Express, and Volvo, Tonic.ai innovates to advance its goal of advocating for the privacy of individuals while enabling companies to do their best work. For more information, visit https://www.tonic.ai or follow /tonicfakedata on LinkedIn.
Benefits we offer
- Competitive salary and equity
- Unlimited paid time off
- 401k plan with employer contribution
- Medical, dental, and vision insurance
- Generous parental leave policy
- Remote-friendly work environment
Benefits we offer
- Generous comp plan with uncapped commission/earning potential
- Computer of choice and stipend to purchase office equipment, etc
#J-18808-Ljbffr
In Summary: Tonic.ai is looking for a hands-on Machine Learning Engineer to help build production-grade NLP systems that power our data privacy and information extraction products . You'll join a small, experienced team working at the intersection of LLMs, data privacy, and applied AI .
En Español:
Tonic.ai está buscando un Ingeniero de Aprendizaje Automático práctico para ayudar a construir sistemas NLP de grado de producción que impulsen nuestros productos de privacidad de datos y extracción de información. Te unirás a un pequeño equipo experimentado trabajando en la intersección de LLM, privacy de datos e IA aplicada desarrollando y sintonizando modelos que detectan y redactan información sensible en diversos conjuntos de datos.
Lo que harás
- Construir y enviar modelos. Afinar y evaluar los modelos basados en transformadores (por ejemplo, RoBERTa, Gemma, LLaMA) para apoyar la redacción de PII, extracción de entidades y generación de datos sintéticos.
- Poseer el ciclo de vida del ML. Desde la curaduría de los conjuntos de datos y el seguimiento experimental hasta el despliegue y monitoreo de modelos, tendrás todo el camino desde el prototipo a la producción.
- Colaborar de manera interfuncional. Colaborar con Product and Design para dar forma a cómo los modelos ML impulsan las características orientadas al usuario, y trabajar con el equipo de ingeniería más amplio para integrarlos en sistemas escalables.
- Experimenta con responsabilidad. Documente sus experimentos, evalúe los resultados rigurosamente y ayude a avanzar en la frontera de inteligencia artificial segura y explicable para la privacidad de datos.
Lo que traerás
- 3+ años de experiencia profesional en ML aplicada o ciencia de datos con enfoque en PNL
- Proficiencia en Python y los marcos de aprendizaje profundo tales como Piorro y Transformadores faciales que se abrazan
- Experiencia práctica con el seguimiento de experimentos (por ejemplo, Pesos y Prejuicios), Formación distribuida (por ejemplo, Acelerado), y modelo de servicio (por ejemplo, VLLM)
- Comodidad para trabajar de forma independiente e iterar rápidamente disfruta de la mezcla de investigación, ingeniería y pensamiento sobre productos
- Fuertes habilidades de comunicación y colaboración
Puntos de bonificación para:
- Experiencia en el ajuste del aprendizaje supervisado y reforzado (por ejemplo, TRL)
- Familiarización con la privacidad de los datos, redacción de PII o datos sanitarios
- Una cartera pública, un blog o contribuciones de código abierto que demuestren su profundidad técnica y curiosidad
Por qué te encantará aquí
- Alta autonomía y una propiedad significativa sus modelos se enviarán a la producción, no estarán en un cuaderno
- Pequeño equipo colaborativo con una profunda experiencia en PNL y privacidad
- Oportunidad para trabajar con datos reales de alto impacto en ámbitos como la salud y los servicios financieros
Sobre Tonic.ai
Tonic.ai empodera a los desarrolladores mientras protege la privacidad del cliente al permitir que las compañías creen versiones seguras y sintéticas de sus datos para su uso en el desarrollo de software, capacitación de modelos e implementación de inteligencia artificial. Fundada en 2018, con oficinas en San Francisco, Atlanta, Nueva York y Londres, la compañía es pionera en herramientas empresariales para la transformación de datos, desidentificación, síntesis y subsetización, en búsqueda de su misión de hacer que los datos sean útiles. Miles de desarrollistas utilizan diariamente los datos generados con Tonica.ai para construir sus productos más rápidamente en industrias como salud, servicios financieros, logística, edición tecnológica y comercio electrónico. Trabajando con clientes como eBay, Cignaton, American Express y Volvo, Tonic .ai avanza su objetivo de abogar por la vida privada de individuos mientras permite realizar su mejor trabajo.
Los beneficios que ofrecemos
- Salario y capital competitivos
- Tiempo libre pagado ilimitado
- Plan 401k con contribución del empleador
- Seguro médico, dental y de visión
- Política de licencia parental generosa
- Ambiente de trabajo a distancia
Los beneficios que ofrecemos
- Plan de compensación generoso con una comisión/potencial de ganancia ilimitado
- Computador de elección y becas para comprar equipos de oficina, etc.
#J-18808-Ljbffr