Senior Machine Learning Engineer, Wallet, Payment & Commerce Job at Apple in New

Apple, New York, NY, United States

Role Number: 200651766-2459

Summary

Would you like to contribute to Machine Learning and Generative AI technologies? Are you curious about the data that drives AI/ML success? Do you believe Machine Learning and AI can change the world? We truly believe it can!

We are building the data infrastructure that powers machine learning across Wallet, Payment, and Commerce; and synthetic data is at the center of that strategy.

Description

As a Machine Learning Engineer specializing in Data Synthesis, you will architect privacy-preserving data generation pipelines that reduce dependency on external data procurement, accelerate model development, and set a new standard for responsible ML at scale.

You'll work at the intersection of cutting-edge generative AI research and production ML systems, collaborating closely with Engineering, Product, Privacy, and Legal teams. This unique opportunity shapes data strategy, impacting features used by millions while pioneering privacy-first ML practices.

Minimum Qualifications

BS/Master's degree in Computer Science, Engineering, Statistics, or a related quantitative field, alternatively equivalent industry experience may be considered.

5+ years of experience driving the design and development of machine learning pipelines as an ML Engineer.

Hands-on experience building synthetic data generation systems using modern generative techniques (GANs, VAEs, diffusion models, or LLM-based approaches), with measurable impact on model performance or data cost reduction.

Hands-on experience synthesizing time series data at scale.

Proficiency in Python and relevant ML frameworks (PyTorch, TensorFlow).

Proficiency in Spark, Ray, or other distributed computing technologies for developing pipelines at scale.

Proficiency in using industry-standard tools and techniques for statistical testing and data experimentation.

Experience with data augmentation across multiple data types (structured, unstructured, and semi-structured).

Strong data exploration and analytical skills, with the ability to assess and characterize diverse data assets.

Proven ability to collaborate across functions (R&D, Privacy, Legal, Infrastructure) and drive cross-team alignment.

Preferred Qualifications

PhD in Computer Science, Data Science, Statistics, AI/ML, or a related field.

Experience with Bayesian or causal graph-based approaches to data generation.

Experience identifying low-quality, erroneous, or fraudulent data at scale.

Deep familiarity with generative architectures including transformers, diffusion models, and multi-modal systems.

Track record of influencing cross-team roadmaps and driving adoption of new tools or infrastructure across organizations.

Apple is an equal opportunity employer that is committed to inclusion and diversity. We seek to promote equal opportunity for all applicants without regard to race, color, religion, sex, sexual orientation, gender identity, national origin, disability, Veteran status, or other legally protected characteristics. Learn more about your EEO rights as an applicant (https://www.eeoc.gov/sites/default/files/2023-06/22-088_EEOC_KnowYourRights6.12ScreenRdr.pdf) .

In Summary: We are building the data infrastructure that powers machine learning across Wallet, Payment, and Commerce . We're building a unique opportunity shapes data strategy, impacting features used by millions while pioneering privacy-first ML practices . 5+ years of experience driving the design and development of machine learning pipelines .

En Español:

Número de rol: 200651766-2459

Resumen

¿Le gustaría contribuir al aprendizaje automático y a las tecnologías de IA generadoras? ¿Está interesado en los datos que impulsan el éxito de la AI/ML?

Estamos construyendo la infraestructura de datos que impulsa el aprendizaje automático en Wallet, Payment y Commerce; y los datos sintéticos están al centro de esa estrategia.

Descripción

Como Ingeniero de Aprendizaje Automático especializado en Síntesis de Datos, usted diseñará tuberías de generación de datos que preserven la privacidad y reduzcan la dependencia de las adquisiciones externas de datos, acelerarán el desarrollo de modelos y establecerán un nuevo estándar para el ML responsable a escala.

Trabajará en la intersección de sistemas generativos innovadores para investigación y producción de inteligencia artificial, colaborando estrechamente con equipos de ingeniería, producto, privacidad y legales. Esta oportunidad única da forma a una estrategia de datos que impacta las características utilizadas por millones mientras es pionera en prácticas de tecnología informática primordiales.

Calificaciones mínimas

Se puede considerar una licenciatura en Ciencias de la Computación, Ingeniería, Estadística o un campo cuantitativo relacionado.

5+ años de experiencia dirigiendo el diseño y desarrollo de tuberías de aprendizaje automático como ingeniero ML.

Experiencia práctica en la construcción de sistemas de generación de datos sintéticos utilizando técnicas generativas modernas (GANs, VAEs, modelos de difusión o enfoques basados en LLM), con un impacto medible sobre el rendimiento del modelo o la reducción de los costes de datos.

Experiencia práctica en la síntesis de datos de series temporales a escala.

Proficiencia en Python y los marcos ML pertinentes (PyTorch, TensorFlow).

Proficiencia en Spark, Ray u otras tecnologías de computación distribuida para desarrollar tuberías a escala.

Proficiencia en el uso de herramientas y técnicas estándar para las pruebas estadísticas y la experimentación con datos.

Experiencia en el aumento de datos a través de múltiples tipos de datos (estructurados, no estructurados y semistrructurados).

Fuertes habilidades de exploración y análisis de datos, con capacidad para evaluar y caracterizar diversos activos de datos.

Capacidad comprobada para colaborar a través de funciones (I+D, Privacidad, Jurídico, Infraestructura) y impulsar la alineación entre equipos.

Qualificaciones preferentes

Doctorado en Informática, Ciencia de Datos, Estadística, IA/ML o un campo relacionado.

Experiencia con enfoques bayesianos o basados en gráficos causales para la generación de datos.

Experiencia en la identificación de datos de baja calidad, erróneos o fraudulentos a escala.

Profunda familiaridad con las arquitecturas generativas, incluyendo transformadores, modelos de difusión y sistemas multimodal.

El historial de la influencia en las hoja de ruta entre equipos y el impulso a la adopción de nuevas herramientas o infraestructuras en todas las organizaciones.

Apple es un empleador de igualdad de oportunidades que está comprometido con la inclusión y la diversidad. Buscamos promover la igualdad para todos los solicitantes sin importar raza, color, religión, sexo, orientación sexual, identidad de género, origen nacional, discapacidad, estatus de veterano u otras características legalmente protegidas. Obtenga más información sobre sus derechos EEO como solicitante (https://www.eeoc.gov/sites/default/files/2023-06/22-088_EEOC_KnowYourRights6.12ScreenRdr.pdf)