
Tempus AI is hiring: Staff Machine Learning Engineer in Chicago
Tempus AI, Chicago, IL, United States
Staff Machine Learning Engineer, Oncology foundation Model
Join to apply for the Staff Machine Learning Engineer, Oncology foundation Model role at Tempus AI
Staff Machine Learning Engineer, Oncology foundation Model
Join to apply for the Staff Machine Learning Engineer, Oncology foundation Model role at Tempus AI
Passionate about precision medicine and advancing the healthcare industry?
Recent advancements in underlying technology have finally made it possible for AI to impact clinical care in a meaningful way. Tempus' proprietary platform connects an entire ecosystem of real-world evidence to deliver real-time, actionable insights to physicians, providing critical information about the right treatments for the right patients, at the right time.
We are seeking an experienced and highly skilled Staff Machine Learning Engineer with deep expertise in large-scale multimodal model systems engineering to join our dynamic AI team. You will play a pivotal role in designing, building, and optimizing the foundational data infrastructure that powers Tempus's most advanced generative AI models. Your work will directly enable the training and deployment of robust, production-ready multimodal systems that analyze complex data types (like genomics, pathology images, radiology scans, and clinical notes) to improve patient care, optimize clinical workflows, and accelerate life-saving medical research. This is a critical, high-impact position for driving the practical application of cutting-edge AI to revolutionize healthcare.
Focus
Your primary focus will be to architect, build, and maintain the critical data infrastructure supporting our large multimodal generative models. This includes managing the entire lifecycle of vast datasets – from ingestion and processing of diverse training data to the integration and retrieval of extensive knowledge sources used to augment model capabilities. You will be building the data backbone that enables our AI to learn from Tempus's rich real-world evidence.
Key Responsibilities
As a technical leader in this space, you will be:
- Architect and build sophisticated data processing workflows responsible for ingesting, processing, and preparing multimodal training data that seamlessly integrate with large-scale distributed ML training frameworks and infrastructure (GPU clusters).
- Develop strategies for efficient, compliant data ingestion from diverse sources, including internal databases, third-party APIs, public biomedical datasets, and Tempus's proprietary data ecosystem.
- Utilize, optimize, and contribute to frameworks specialized for large-scale ML data loading and streaming (e.g., MosaicML Streaming, Ray Data, HF Datasets).
- Collaborate closely with infrastructure and platform teams to leverage and optimize cloud-native services (primarily GCP) for performance, cost-efficiency, and security.
- Engineer efficient connectors and data loaders for accessing and processing information from diverse knowledge sources, such as knowledge graphs, internal structured databases, biomedical literature repositories (e.g., PubMed), and curated ontologies.
- Optimize data storage for efficient large scale training training and knowledge access.
- Orchestrate, monitor, and troubleshoot complex data workflows using tools like Airflow, Kubeflow Pipelines..
- Establish robust monitoring, logging, and alerting systems for data pipeline health, data drift detection, and data quality assurance, providing feedback loops for continuous improvement.
- Analyze and optimize data I/O performance bottlenecks considering storage systems, network bandwidth and compute resources.
- Actively manage and seek optimizations for the costs associated with storing and processing massive datasets in the cloud.
- Master's degree in Computer Science, Artificial Intelligence, Software Engineering, or a related field. A strong academic background with a focus on AI data engineering.
- Proven track record (8+ years of industry experience) in designing, building, and operating large-scale data pipelines and infrastructure in a production environment.
- Strong experience working with massive, heterogeneous datasets (TBs+) and modern distributed data processing tools and frameworks such as Apache Spark, Ray, or Dask.
- Strong, hands-on experience with tools and libraries specifically designed for large-scale ML data handling, such as Hugging Face Datasets, MosaicML Streaming, or similar frameworks (e.g., WebDataset, Petastorm). Experience with MLOps tools and platforms (e.g., MLflow, Kubeflow, SageMaker Pipelines).
- Understanding of the data challenges specific to training large models (Foundation Models, LLMs, Multimodal Models).
- Proficiency in programming languages like Python and experience with modern distributed data processing tools and frameworks.
- Leadership and collaboration:
- Proven ability to bring thought leadership to the product and engineering teams, influencing technical direction and data strategy.
- Experience mentoring junior engineers and collaborating effectively with cross-functional teams (Research Scientists, ML Engineers, Platform Engineers, Product Managers, Clinicians).
- Excellent communication skills, capable of explaining complex technical concepts to diverse audiences.
- Strong bias-to-action and ability to thrive in a fast-paced, dynamic research and development environment.
- A pragmatic approach focused on delivering rapid, iterative, and measurable progress towards impactful goals.
- Advanced degree (PhD) in Computer Science, Engineering, Bioinformatics, or a related field.
- Contributions to relevant open-source projects.
- Direct experience working with clinical or biological data (EHR, genomics, medical imaging).
California Pay Range - $190,000 - $230,000 USD
Illinois Pay Range - $170,000 - $210,000 USD
Remote - USA Range - $170,000 - $210,000 USD
The expected salary range above is applicable if the role is performed from California and may vary for other locations (Colorado, Illinois, New York). Actual salary may vary based on qualifications and experience. Tempus offers a full range of benefits, which may include incentive compensation, restricted stock units, medical and other benefits depending on the position.
Additionally, for remote roles open to individuals in unincorporated Los Angeles – including remote roles- Tempus reasonably believes that criminal history may have a direct, adverse and negative relationship on the following job duties, potentially resulting in the withdrawal of the conditional offer of employment: engaging positively with customers and other employees; accessing confidential information, including intellectual property, trade secrets, and protected health information; and appropriately handling such information in accordance with legal and ethical standards. Qualified applicants with arrest or conviction records will be considered for employment in accordance with applicable law, including the Los Angeles County Fair Chance Ordinance for Employers and the California Fair Chance Act.
We are an equal opportunity employer. We do not discriminate on the basis of race, religion, color, national origin, gender, sexual orientation, age, marital status, veteran status, or disability status.
Seniority level
Seniority level
Mid-Senior level
Employment type
Employment type
Full-time
Job function
Job function
Engineering and Information Technology
Referrals increase your chances of interviewing at Tempus AI by 2x
Sign in to set job alerts for “Machine Learning Engineer” roles.
Artificial Intelligence/Machine Learning (AI/ML) Engineer
Chicago, IL $135,000.00-$175,000.00 1 day ago
Chicago, IL $111,500.00-$191,950.00 4 hours ago
Chicago, IL $93,840.00-$140,760.00 2 weeks ago
Chicago, IL $88,800.00-$165,600.00 1 week ago
Chicago, IL $123,500.00-$212,850.00 2 months ago
Chicago, IL $123,500.00-$212,850.00 2 months ago
Chicago, IL $123,500.00-$212,850.00 3 months ago
Chicago, IL $70,000.00-$100,000.00 2 days ago
Chicago, IL $100,500.00-$173,250.00 3 weeks ago
Chicago, IL $160,000.00-$175,000.00 1 week ago
Chicago, IL $123,500.00-$212,850.00 1 month ago
Chicago, IL $123,500.00-$212,850.00 1 month ago
Chicago, IL $91,770.00-$125,070.00 20 hours ago
Chicago, IL $85,000.00-$120,000.00 22 minutes ago
Chicago, IL $80,000.00-$100,000.00 3 days ago
Chicago, IL $135,000.00-$205,000.00 1 week ago
Chicago, IL $75,000.00-$85,000.00 4 days ago
Chicago, IL $133,000.00-$287,800.00 1 week ago
Chicago, IL $140,000.00-$240,000.00 1 day ago
Chicago, IL $135,000.00-$170,000.00 1 week ago
Chicago, IL $200,000.00-$225,000.00 3 days ago
Chicago, IL $68,000.00-$110,000.00 1 week ago
Chicago, IL $135,000.00-$170,000.00 1 week ago
Chicago, IL $75,000.00-$93,000.00 1 week ago
We’re unlocking community knowledge in a new way. Experts add insights directly into each article, started with the help of AI.
#J-18808-Ljbffr
En Español:
Ingeniero de aprendizaje automático del personal, modelo de la fundación de Oncología
Participar para solicitar el Ingeniero de aprendizaje automático del personal, modelo de la fundación de Oncología papel en el Tempus AI
Ingeniero de aprendizaje automático del personal, modelo de la fundación de Oncología
Participar para solicitar el Ingeniero de aprendizaje automático del personal, modelo de la fundación de Oncología papel en el Tempus AI
¿Pasionado por la medicina de precisión y el avance de la industria de la salud?
Los avances recientes en la tecnología subyacente finalmente han hecho posible que la IA tenga un impacto significativo en la atención clínica. La plataforma propietaria de Tempus conecta todo un ecosistema de evidencia del mundo real para ofrecer información en tiempo real y práctica a los médicos, proporcionando información crítica sobre los tratamientos correctos para los pacientes adecuados, en el momento adecuado.
Buscamos un experto y altamente calificado Ingeniero de aprendizaje automático del personal con una profunda experiencia en Ingeniería de sistemas de modelos multimodal a gran escala Usted desempeñará un papel fundamental en el diseño, construcción y optimización de la infraestructura de datos fundamentales que impulsa los modelos de IA generativos más avanzados de Tempus. Su trabajo permitirá directamente la capacitación y implementación de sistemas multimodal robustos y listos para la producción que analizan tipos de datos complejos (como genómica, imágenes de patología, exploraciones radiológicas y notas clínicasEn la actualidad, la industria de la inteligencia artificial (IA) se ha convertido en una tecnología innovadora para mejorar la atención a los pacientes, optimizar los flujos de trabajo clínicos y acelerar la investigación médica que salva vidas.
Concentrarse
Tu enfoque principal será de undiseñar, construir y mantener la infraestructura de datos críticos Esto incluye la gestión de todo el ciclo de vida de vastos conjuntos de datos, desde la ingestión y procesamiento de diversos datos de capacitación hasta la integración y recuperación de extensas fuentes de conocimiento utilizadas para aumentar las capacidades del modelo.
Responsabilidades clave
Como líder técnico en este espacio, usted será:
- Arquitectar y construir flujos de trabajo de procesamiento de datos sofisticados responsables de la ingestión, procesamiento y preparación de datos de capacitación multimodal que se integran perfectamente con los marcos e infraestructura de formación de ML distribuidos a gran escala (clusters de GPU).
- Desarrollar estrategias para la ingestión eficiente y compatible de datos de diversas fuentes, incluidas bases de datos internas, API de terceros, conjuntos de datos biomédicos públicos y el ecosistema de datos propietario de Tempus.
- Utilice, optimice y contribuya a marcos especializados para la carga y transmisión de datos ML a gran escala (por ejemplo, MosaicML Streaming, Ray Data, Datasets HF).
- Colaborar estrechamente con equipos de infraestructura y plataformas para aprovechar y optimizar los servicios nativos de la nube (principalmente GCP) para el rendimiento, la rentabilidad y la seguridad.
- Ingeniero de conectores y cargadores de datos eficientes para acceder y procesar información de diversas fuentes de conocimiento, como gráficos de conocimientos, bases de datos estructuradas internas, repositorios de literatura biomédica (por ejemplo, PubMed) y ontologías curadas.
- Optimizar el almacenamiento de datos para una formación eficiente y un acceso al conocimiento a gran escala.
- Orquestar, monitorear y solucionar problemas flujos de trabajo de datos complejos utilizando herramientas como Airflow, Kubeflow Pipelines..
- Establecer sistemas sólidos de monitoreo, registro y alerta para la salud de las tuberías de datos, la detección de deriva de datos y la garantía de la calidad de los datos, proporcionando circuitos de retroalimentación para una mejora continua.
- Analizar y optimizar los cuellos de botella del rendimiento de entrada y salida de datos teniendo en cuenta los sistemas de almacenamiento, el ancho de banda de red y los recursos informáticos.
- Gestionar activamente y buscar optimizaciones para los costes asociados con el almacenamiento y procesamiento de conjuntos masivos de datos en la nube.
- Máster en Ciencias de la Computación, Inteligencia Artificial, Ingeniería de Software o un campo relacionado. Un sólido fondo académico con un enfoque en ingeniería de datos de IA.
- Un historial comprobado (más de 8 años de experiencia en la industria) en el diseño, construcción y operación de tuberías e infraestructuras de datos a gran escala en un entorno de producción.
- Fuerte experiencia trabajando con conjuntos de datos masivos y heterogéneos (TB+) y modernas herramientas y marcos de procesamiento de datos distribuidos como Apache Spark, Ray o Dask.
- Experiencia práctica y sólida con herramientas y bibliotecas diseñadas específicamente para el manejo de datos ML a gran escala, como Hugging Face Datasets, MosaicML Streaming o marcos similares (por ejemplo, WebDataset, Petastorm).
- Comprender los retos de los datos específicos para la formación de modelos grandes (modelos de fundación, LLM, modelos multimodal).
- Proficiencia en lenguajes de programación como Python y experiencia con herramientas y marcos modernos de procesamiento de datos distribuidos.
- Liderazgo y colaboración:
- Capacidad comprobada para llevar el liderazgo mental a los equipos de producto e ingeniería, influyendo en la dirección técnica y la estrategia de datos.
- Experiencia en la orientación de ingenieros jóvenes y en la colaboración efectiva con equipos interfuncionales (científicos de investigación, ingenieros ML, ingeniarios de plataformas, gerentes de productos, médicos).
- Excelentes habilidades de comunicación, capaces de explicar conceptos técnicos complejos a diversos públicos.
- Un fuerte sesgo hacia la acción y la capacidad de prosperar en un entorno de investigación y desarrollo rápido y dinámico.
- Un enfoque pragmático centrado en lograr un progreso rápido, iterativo y medible hacia objetivos impactantes.
- Grado avanzado (PhD) en Ciencias de la Computación, Ingeniería, Bioinformática o un campo relacionado.
- Contribuciones a proyectos de código abierto pertinentes.
- Experiencia directa trabajando con datos clínicos o biológicos (EHR, genómica, imágenes médicas).
Rango de pago de California - $190,000 - $230,000 USD
Rango de pago de Illinois - $170,000 - $210,000 USD
Distante - Rango de Estados Unidos - $170,000 - $210,000 USD
El rango de salario esperado anterior es aplicable si el papel se desempeña desde California y puede variar para otras ubicaciones (Colorado, Illinois, Nueva York). El salario real puede cambiar en función de las calificaciones y la experiencia. Tempus ofrece una gama completa de beneficios, que pueden incluir compensación de incentivo, unidades de stock restringidas, beneficios médicos y otros dependiendo de la posición.
Además, para roles remotos abiertos a individuos en Los Ángeles no incorporada incluidos los roles remotos Tempus cree razonablemente que el historial penal puede tener una relación directa, adversa y negativa con los siguientes deberes laborales, lo que podría resultar en la retirada de la oferta condicional de empleo: interactuar positivamente con los clientes y otros empleados; acceder a información confidencial, incluida la propiedad intelectual, secretos comerciales e información sanitaria protegida; y manejar adecuadamente dicha información de acuerdo con las normas legales y éticas. Los solicitantes calificados con antecedentes de arresto o condenación serán considerados para el empleo de conformidad con la ley aplicable, incluyendo la Ordenanza del Condado de Los Ángeles para la Oportunidad Justa de Empleadores y la Ley de Oportunidades Justas de California.
Somos un empleador de igualdad de oportunidades. No discriminamos por raza, religión, color, origen nacional, género, orientación sexual, edad, estado civil, estatus de veterano o estado de discapacidad.
Nivel de antigüedad
Nivel de antigüedad
Nivel medio-senior
Tipo de empleo
Tipo de empleo
Trabajo a tiempo completo
Función del trabajo
Función del trabajo
Ingeniería y tecnología de la información
Las referencias aumentan sus posibilidades de entrevistarse en Tempus AI en 2x
Inscríbete para configurar alertas de trabajo para las funciones de ingeniero de aprendizaje automático.
Ingeniero de inteligencia artificial/aprendizaje automático (AI/ML)
Chicago, IL $135,000.00- $175,000.00 hace un día
Chicago, IL $111,500.00- $191,950.00 hace 4 horas
Chicago, IL $93,840.00 $140,760.00 hace 2 semanas
Chicago, IL $88,800.00 $165,600.00 hace una semana
Chicago, IL $123,500.00- $212,850.00 hace dos meses
Chicago, IL $123,500.00- $212,850.00 hace dos meses
Chicago, IL $123,500.00- $212,850.00 hace 3 meses
Chicago, IL $70,000.00- $100,000.00 hace 2 días
Chicago, IL $100,500.00- $173,250.00 hace 3 semanas
Chicago, IL $160,000.00- $175,000.00 hace una semana
Chicago, IL $123,500.00- $212,850.00 hace un mes
Chicago, IL $123,500.00- $212,850.00 hace un mes
Chicago, IL $91,770.00- $125,070.00 hace 20 horas
Chicago, IL $85,000.00- $120,000.00 hace 22 minutos
Chicago, IL $80,000.00- $100,000.00 hace 3 días
Chicago, IL $135,000.00- $205,000.00 hace una semana
Chicago, IL $75,000.00- $85,000.00 hace 4 días
Chicago, IL $133,000.00- $287,800.00 hace una semana
Chicago, IL $140,000.00- $240,000.00 hace un día
Chicago, IL $135,000.00- $170,000.00 hace una semana
Chicago, IL $200,000.00- $225,000.00 hace 3 días
Chicago, IL $68,000.00- $110,000.00 hace una semana
Chicago, IL $135,000.00- $170,000.00 hace una semana
Chicago, IL $75,000.00- $93,000.00 hace una semana
Estamos desbloqueando el conocimiento de la comunidad de una nueva manera. Los expertos añaden información directamente a cada artículo, comenzando con la ayuda de la IA.
#J-18808-Ljbffr