US Company is hiring: Machine Learning Engineer, Foundation Model in San Jose

US Company, San Jose, CA, United States

Machine Learning Engineer, Foundation Model

San Jose, CA

About The Company

DiDi's autonomous driving unit was established in 2016 with the mission of developing Level 4 autonomous driving (AD) technology to make transportation safer and more efficient. In August 2019, the unit became an independent company, DiDi Autonomous Driving, dedicated to advanced AD R&D, product application, and business expansion. We believe integrating AD technology into a shared-mobility fleet will generate immense social value. By leveraging DiDi's specialized technology, operational expertise, and integrated ecosystem, we are positioned to build and operate a highly efficient, user-oriented autonomous fleet.

About The Role

The Foundation Model Team focuses on building large-scale foundation models for multi-agent behavior prediction and autonomous vehicle planning. By leveraging DiDi Voyager’s unparalleled driving data, we train highly robust and generalizable deep learning systems that enable safe and intelligent autonomous driving at scale.

Our models serve as the core intelligence of the autonomous driving stack, enabling vehicles to understand complex traffic scenarios, anticipate agent behavior, and make safe and efficient driving decisions.

We operate at the intersection of large-scale machine learning, autonomous driving, and foundation model research, pushing the frontier of multi-agent prediction and planning.

Responsibilities

Design and train large-scale deep learning models for multi-agent trajectory prediction, behavior and intent prediction, and planning and decision-making.

Build foundation model architectures (Transformers, Diffusion, Flow-based models, Decision models, VLM/VLA).

Develop scalable training pipelines across hundreds to thousands of GPUs.

Work with massive real-world datasets and build high-quality data pipelines.

Optimize models for latency, reliability, and on-vehicle deployment.

Collaborate closely with perception, mapping, simulation, and systems teams.

Drive research ideas into production systems used by real autonomous vehicles.

Qualifications

Strong background in machine learning, deep learning, or robotics.

Experience with PyTorch / JAX / TensorFlow.

Solid understanding of modern neural architectures (transformers, diffusion, auto-regressive).

Strong coding skills in Python and C++.

Passion for building real-world, safety-critical AI systems.

Preferred Qualifications

BS, MS or PhD in Computer Science, Machine Learning, Robotics, or a related field.

Experience in autonomous driving, robotics, or embodied AI.

Experience training large models on distributed GPU clusters.

Experience with trajectory prediction, planning, or decision-making systems.

Publications in top ML / robotics conferences (NeurIPS, ICML, ICLR, CVPR, RSS, CoRL, etc.).

The base salary range for this position is $129,189-$247,038 annually in addition to bonus, equity and benefits. Our salary ranges are determined by role, level, and location. Within the range, individual pay is determined by work location and additional factors, including job-related skills, experience, and relevant education or training.

#J-18808-Ljbffr

In Summary: DiDi's autonomous driving unit was established in 2016 with the mission of developing Level 4 autonomous driving technology . The Foundation Model Team focuses on building large-scale foundation models for multi-agent behavior prediction and autonomous vehicle planning . The base salary range for this position is $129,189-$247,038 annually .

En Español: En agosto de 2019, la unidad se convirtió en una compañía independiente, DiDi Autonomous Driving, dedicada a la investigación y desarrollo avanzados de AD, aplicación del producto y expansión empresarial. Creemos que integrar la tecnología AD en una flota de movilidad compartida generará un inmenso valor social. Aprovechando la tecnología especializada, experiencia operativa y ecosistema integrado de DiDi, estamos posicionados para construir y operar una flota autónoma altamente eficiente y orientada al usuario. El equipo de la fundación autonómica se enfoca en desarrollar modelos de base de grandes agentes para predicir el comportamiento a gran escala y comprender las necesidades generales. Responsabilidades Diseñar y entrenar modelos de aprendizaje profundo a gran escala para predicción de trayectoria multi-agente, predicción del comportamiento e intención en el vehículo, planificación y toma de decisiones. Construir arquitecturas de modelo base (Transformadores, Difusión, modelos basados en flujo, modelos de decisión, VLM / VLA). Desarrollar tuberías de capacitación escalables en cientos o miles de GPUs. Trabajar con conjuntos masivos de datos del mundo real y construir tuberas de datos de alta calidad. Optimizar los modelos para la latencia, fiabilidad y implementación en vehículos. Colaborar estrechamente con sistemas de percepción, mapeo, simulación y sistemas de GPU. Impulsar ideas de investigación en sistemas de producción utilizados por vehículos autónomos reales. Qualificaciones Fortes en aprendizaje automático, aprendizaje profunda o robótica. Experiencia con PyTorch / JAX / NexoFlow. Nuestros rangos salariales se determinan por rol, nivel y ubicación. Dentro del rango, el salario individual está determinado por la localización de trabajo y factores adicionales, incluyendo habilidades relacionadas con el empleo, experiencia y educación o capacitación relevantes. #J-18808-Ljbffr