Mediabistro logo
job logo

Senior Applied AI Engineer (Multimodal Perception & Reasoning) Job at VOLT AI in

VOLT AI, San Francisco, CA, United States


Senior Applied AI & Machine Learning Engineer

VOLT is building the next generation of AI perception systems for the physical world, focused on safety, security, and real-time risk detection.

We are seeking a Senior Applied AI & Machine Learning Engineer to design, optimize, and ship multimodal AI models that operate reliably in real-world environments. This is a deeply applied role, centered on taking models from data to productionacross both edge devices and cloud infrastructure.

You will work on vision, video, and language-based models that understand real-world scenes and events, and you will be accountable for their accuracy, latency, robustness, and cost in production systems. This role reports directly to the Head of Engineering and plays a critical role in advancing VOLT AI's core perception platform.

Key Responsibilities
  • Build, fine-tune, and deploy production-grade multimodal models for safety and security applications, with a focus on visual and video perception, language-assisted and multimodal reasoning, and temporal understanding of real-world environments
  • Own the full applied ML lifecycle, including data collection, labeling strategies, and dataset curation, model fine-tuning, evaluation, and iteration, and deployment, monitoring, and continuous improvement in production
  • Drive model performance in real-world conditions, optimizing for high precision and recall, low false positives and false negatives, and robustness to noise, lighting changes, occlusion, and domain shift
  • Optimize models for edge and cloud deployment, including quantization, pruning, and model compression, latency, throughput, and memory optimization, and hardware-aware tuning for GPUs and edge accelerators
  • Build and maintain training and inference pipelines that support scalable experimentation and evaluation, reproducibility and model versioning, and reliable production deployment
  • Collaborate closely with infrastructure and systems engineers to integrate models into real-time perception pipelines, balance accuracy, performance, and cost constraints, and diagnose and resolve production inference issues
  • Use real-world deployment feedback and metrics to drive data and model improvements
Required Qualifications
  • 8+ years of experience in applied machine learning or AI systems
  • Strong hands-on experience with vision, video, or multimodal models
  • Proven experience taking models into production, not just research prototypes
  • Deep understanding of model optimization (quantization, pruning, performance tuning)
  • Proficiency in Python and modern ML frameworks (e.g., PyTorch)
  • Experience evaluating models using real-world metrics and constraints
  • Ability to operate independently and own complex technical systems end to end
Preferred Qualifications
  • Experience with multimodal or vision-language models (CLIP-like, BLIP-like, or custom)
  • Experience deploying models to edge or resource-constrained environments
  • Familiarity with inference optimization stacks (ONNX, TensorRT, CUDA)
  • Experience working on physical-world perception systems (video, sensors, environments)
  • Background in safety, security, robotics, or autonomous systems
  • Experience mentoring senior engineers or providing technical leadership
What Success Looks Like
  • Models ship reliably and improve measurable safety outcomes
  • Precision and recall improve while inference cost and latency decrease
  • Edge and cloud inference pipelines operate at production scale
  • Data and model iteration loops accelerate over time
  • AI perception becomes a durable competitive advantage for VOLT AI

$175,000 - $220,000 a year

At VOLT AI, you will build applied AI systems that run in the real worldon live video, in real environments, under real constraints. This role is for an engineer who wants to ship models, optimize them aggressively, and see their impact in production, not publish papers.



In Summary: VOLT is building the next generation of AI perception systems for the physical world . We are seeking a Senior Applied AI & Machine Learning Engineer to design, optimize, and ship multimodal AI models that operate reliably in real-world environments . This is a deeply applied role centered on taking models from data to production across edge devices and cloud infrastructure .

En Español:
Ingeniero senior de IA aplicada y aprendizaje automático

VOLT está construyendo la próxima generación de sistemas de percepción AI para el mundo físico, enfocados en seguridad y detección de riesgos en tiempo real.

Buscamos un ingeniero de IA aplicada y aprendizaje automático senior para diseñar, optimizar y enviar modelos multimodal de IA que funcionen confiablemente en entornos del mundo real.

Trabajará en modelos basados en visión, video y lenguaje que comprendan escenas y eventos del mundo real, y será responsable de su precisión, latencia, robustez y costo en los sistemas de producción.

Responsabilidades clave
  • Construir, ajustar y implementar modelos multimodal de calidad productiva para aplicaciones de seguridad y protección, centrándose en la percepción visual y video, el razonamiento multimoidal asistido por lenguaje y la comprensión temporal de los entornos del mundo real
  • Poseer todo el ciclo de vida del ML aplicado, incluida la recopilación de datos, las estrategias de etiquetado y la curaduría de conjuntos de datos; ajuste fino del modelo, evaluación e iteración; implementación, seguimiento y mejora continua en la producción.
  • Impulsar el rendimiento del modelo en condiciones reales, optimizando para una alta precisión y recuerdo, bajos falsos positivos y negativos falsos, robustez al ruido, cambios de iluminación, oclusión y cambio de dominio
  • Optimizar los modelos para la implementación de Edge y Cloud, incluyendo cuantización, poda y compresión del modelo, latencia, rendimiento y optimización de memoria, así como ajuste consciente de hardware para GPUs y aceleradores de Edge
  • Construir y mantener líneas de formación e inferencia que apoyen la experimentación y evaluación escalables, la reproducibilidad y la versión del modelo y el despliegue fiable de producción
  • Colaborar estrechamente con los ingenieros de infraestructura y sistemas para integrar modelos en tuberías de percepción en tiempo real, equilibrar la precisión, el rendimiento y las restricciones de costes, y diagnosticar y resolver problemas de inferencia productiva
  • Utilice retroalimentación y métricas de implementación del mundo real para impulsar mejoras en los datos y modelos
Qualificaciones requeridas
  • 8+ años de experiencia en sistemas aplicados de aprendizaje automático o IA
  • Fuerte experiencia práctica con modelos de visión, vídeo o multimodal
  • Experiencia comprobada con la introducción de modelos en producción, no sólo prototipos de investigación
  • Comprensión profunda de la optimización del modelo (cuantificación, poda, ajuste de rendimiento)
  • Proficiencia en Python y los marcos modernos de ML (por ejemplo, PyTorch)
  • Experiencia en la evaluación de modelos utilizando métricas y restricciones del mundo real
  • Capacidad para operar de forma independiente y poseer sistemas técnicos complejos
Qualificaciones preferentes
  • Experiencia con modelos multimodal o de lenguaje visual (como CLIP, BLIP o personalizado)
  • Experiencia en el despliegue de modelos a entornos marginados o limitados por recursos
  • Familiarización con las pilas de optimización de inferencias (ONNX, TensorRT, CUDA)
  • Experiencia trabajando en sistemas de percepción del mundo físico (vídeo, sensores y entornos)
  • Antecedentes en seguridad, robótica o sistemas autónomos
  • Experiencia en asesoramiento de ingenieros superiores o liderazgo técnico
Cómo es el éxito
  • Los modelos se envían confiablemente y mejoran los resultados de seguridad medibles
  • La precisión y el recuerdo mejoran mientras que los costes de inferencia y la latencia disminuyen
  • Las tuberías de inferencia por borde y nube funcionan a escala productiva
  • Los bucles de iteración de datos y modelos se aceleran con el tiempo
  • La percepción de la IA se convierte en una ventaja competitiva duradera para VOLT AI

175.000 - 220.000 dólares al año

En VOLT AI, construirás sistemas de IA aplicados que se ejecutan en el mundo real con video en vivo, en entornos reales y bajo restricciones reales.