Waymo is hiring: Senior Machine Learning Engineer, LLM/VLM Visual Reasoning in S

Waymo, San Francisco, CA, United States

Waymo is an autonomous driving technology company with the mission to be the world's most trusted driver. Since its start as the Google Self-Driving Car Project in 2009, Waymo has focused on building the Waymo Driver-The World's Most Experienced Driver-to improve access to mobility while saving thousands of lives now lost to traffic crashes. The Waymo Driver powers Waymo's fully autonomous ride-hail service and can also be applied to a range of vehicle platforms and product use cases. The Waymo Driver has provided over ten million rider-only trips, enabled by its experience autonomously driving over 100 million miles on public roads and tens of billions in simulation across 15+ U.S. states.

The mission of the Waymo AI Foundations team is to develop machine learning solutions addressing open problems in autonomous driving, towards the goal of safely operating Waymo vehicles in dozens of cities and under all driving conditions. As part of our work, we also initiate and foster collaborations with other research teams in Alphabet. AI Foundations areas that we are currently focusing on include reinforcement learning, learning from demonstration, generative modeling, Bayesian inference, hierarchical learning, and robust evaluation.

This role follows a hybrid work schedule and you will report to a Staff Research Scientist.

You will:

Design and implement cutting-edge models and algorithms for spatial-temporal visual reasoning in autonomous driving scenarios, utilizing large language and vision models (LLM/VLM).

Develop and maintain robust training and evaluation pipelines for VLM models, focusing on metrics relevant to decision-making rationale and free-form question answering.

Collaborate with ML engineers and researchers to integrate visual reasoning capabilities into product systems.

Lead the effort to set up proper large-scale rationale/QA data and establish rigorous evaluation metrics for visual reasoning tasks.

Explore and implement advanced techniques, including Supervised Fine-Tuning (SFT) and Reinforcement Learning (RL), to optimize model performance for complex visual reasoning challenges.

Analyze and interpret large-scale sensor data to identify key challenges and opportunities for improving LLM/VLM performance in real-world driving environments.

You have:

5+ years of experience in Machine Learning, with a focus on large-scale model development (LLM, VLM, or similar foundation models).

Proven expertise in visual reasoning, scene understanding, or related areas within autonomous driving, robotics, or computer vision.

Strong coding proficiency in Python and deep learning frameworks (e.g., Jax, TensorFlow, PyTorch).

Hands-on experience with model training, evaluation, and deployment in a production environment.

Master's degree in Computer Science, Electrical Engineering, or a related field, or equivalent practical experience.

We prefer:

Experience with advanced training techniques, such as Supervised Fine-Tuning (SFT) or Reinforcement Learning (RL) for language/vision models.

Familiarity with large-scale data curation and quality assurance processes for multimodal datasets (e.g., rationale/QA data).

Background in autonomous vehicle perception, motion planning, or decision-making systems.

Publications in top-tier machine learning or computer vision conferences (e.g., NeurIPS, ICML, CVPR, ICCV, ECCV).

PhD in a relevant field.

The expected base salary range for this full-time position across US locations is listed below. Actual starting pay will be based on job-related factors, including exact work location, experience, relevant training and education, and skill level. Your recruiter can share more about the specific salary range for the role location or, if the role can be performed remote, the specific salary range for your preferred location, during the hiring process.

Waymo employees are also eligible to participate in Waymo's discretionary annual bonus program, equity incentive plan, and generous Company benefits program, subject to eligibility requirements.

Salary Range $204,000—$259,000 USD

In Summary: Waymo is an autonomous driving technology company with the mission to be the world's most trusted driver . The Waymo Driver powers Waymos fully autonomous ride-hail service and can be applied to a range of vehicle platforms and product use cases . In this hybrid role, you will report to a Staff Research Scientist .

En Español:

Presentación general

Waymo es una compañía de tecnología de conducción autónoma con la misión de ser el conductor más confiable del mundo. Desde su inicio como Google Self-Driving Car Project en 2009, Waymo se ha centrado en construir Waymo Driver, el Conductor Más Experimentado del Mundo para mejorar el acceso a la movilidad mientras salva miles de vidas ahora perdidas por accidentes de tránsito.

La misión del equipo de Waymo AI Foundations es desarrollar soluciones de aprendizaje automático que aborden problemas abiertos en la conducción autónoma, hacia el objetivo de operar con seguridad vehículos Waymo en docenas de ciudades y bajo todas las condiciones de manejo.

En este papel híbrido, reportará a un científico de investigación del personal.

Responsabilidades

Diseñar e implementar modelos y algoritmos de vanguardia para el razonamiento visual espacial-temporal en escenarios de conducción autónoma, utilizando grandes modelos de lenguaje y visión (LLM/VLM).
Desarrollar y mantener fuertes líneas de capacitación y evaluación para los modelos VLM, centrándose en las métricas relevantes para la justificación de la toma de decisiones y la respuesta a preguntas en forma libre.
Colaborar con ingenieros y investigadores ML para integrar las capacidades de razonamiento visual en los sistemas del producto.
Dirigir los esfuerzos para establecer datos racionales/QA a gran escala adecuados y establecer métricas de evaluación rigurosas para las tareas de razonamiento visual.
Explorar e implementar técnicas avanzadas, incluidas la Supervised Fine-Tuning (SFT) y el Reinforcement Learning (RL), para optimizar el rendimiento del modelo para los complejos desafíos de razonamiento visual.
Analizar e interpretar los datos de sensores a gran escala para identificar desafíos y oportunidades clave para mejorar el rendimiento del LLM/VLM en entornos reales de conducción.

Qualificaciones

5+ años de experiencia en aprendizaje automático, con un enfoque en el desarrollo de modelos a gran escala (LLM, VLM o modelos fundacionales similares).
Experiencia comprobada en el razonamiento visual, la comprensión de las escenas o áreas relacionadas dentro de la conducción autónoma, robótica o visión por ordenador.
Fuertes conocimientos de codificación en Python y marcos de aprendizaje profundo (por ejemplo, Jax, TensorFlow, PyTorch).
Experiencia práctica con la formación, evaluación y implementación de modelos en un entorno productivo.
Máster en Ciencias de la Computación, Ingeniería Eléctrica o un campo relacionado o experiencia práctica equivalente.

Qualificaciones preferentes

Experiencia en técnicas de capacitación avanzada, como el ajuste fino supervisado (SFT) o el aprendizaje por refuerzo (RL) para modelos lingüísticos/visionales.
Familiarización con los procesos de conservación y garantía de calidad a gran escala para conjuntos de datos multimodal (por ejemplo, datos racionales/QA).
Antecedentes en la percepción de vehículos autónomos, planificación del movimiento o sistemas de toma de decisiones.
Publicaciones en conferencias de aprendizaje automático o visión por ordenador (por ejemplo, NeurIPS, ICML, CVPR, ICCV, ECCV).
Doctorado en un campo relevante.

Compensación y beneficios

El rango de salario básico esperado para este puesto a tiempo completo en todas las ubicaciones de los Estados Unidos se enumera a continuación.

Los empleados de Waymo también son elegibles para participar en el programa de bonificaciones anuales discrecionales de Waymos, el plan de incentivos por capital y el generoso programa de beneficios a la empresa, sujeto a los requisitos de elegibilidad.

Rango de sueldo: $204,000$259,000 USD

#J-18808-Ljbffr