Troveo AI Inc is hiring: Senior Machine Learning Engineer in San Francisco

Troveo AI Inc, San Francisco, CA, United States

About Troveo

Troveo is building the next-generation data platform to train AI video models. Troveo offers the world's largest library of AI video training data, featuring millions of hours of licensed video content. Our end-to-end data pipeline connects creators, rights holders, and AI research labs, enabling scalable, compliant, and innovative uses of video across for AI application and model development.

We are an early-stage, high-growth venture backed by forward-thinking investors, and we are seeking an innovative strategic engineer to help us scale.

Role Overview

The Senior Machine Learning Engineer will play a central role in designing, building, and optimizing large-scale machine learning pipelines for AI video model training. You'll work across the full ML lifecycle, from structuring massive datasets to deploying, evaluating, and training models in production.

This is a hands-on, high-impact role for an engineer who thrives on scale, autonomy, and cross-functional collaboration. You will combine deep technical expertise with strong communication and business acumen, translating models into measurable costs, performance targets, and real-world outcomes.

Key Responsibilities

Data Curation & Indexing Pipelines

Architect and implement large-scale pipelines for video ingestion, metadata extraction, and indexing using vector databases and embedding models to enable fast, semantic retrieval.
Design annotation workflows integrating active learning, weak supervision, and human-in-the-loop systems to curate high-quality labeled datasets for video models.
Contribute to optimizing data partitioning, sharding, and caching strategies to handle petabyte-scale video corpora, ensuring low-latency search and robust data lineage.

Model Training & Evaluation

Develop and fine-tune multimodal models (e.g., CLIP variants, transformer-based encoders) for video embeddings, scene segmentation, and relevance ranking using PyTorch and Hugging Face.
Build evaluation frameworks with metrics like NDCG, mAP, and annotation consistency scores to iteratively improve search accuracy and annotation efficiency.
Deploy models via containerized services with A/B testing and monitoring for drift detection in production search and annotation pipelines.
Collaborate with Product and Operations teams to translate ML performance into business insights and cost implications.

Infrastructure & Optimization

Scale ML infrastructure on AWS, leveraging multi-GPU clusters and distributed training to accelerate embedding computation and indexing jobs.
Implement testing and deployment processes across large distributed systems. Fine-tune OSS models. Working knowledge in training large models is a plus.
Implement automated CI/CD for model versioning, hyperparameter tuning, and resource orchestration to minimize compute costs and maximize GPU utilization.
Profile and tune systems for bottlenecks in vector similarity search, batch annotation, and real-time querying.

Cross-Functional Collaboration

Partner with product, research, and data teams to align ML outputs with business KPIs, such as search latency targets and annotation throughput.
Translate technical trade-offs (e.g., recall vs. precision in embeddings) into actionable insights for stakeholders, fostering adoption in video discovery features.
Work closely with data engineers, research scientists, and product teams to align model performance with strategic business goals.
Communicate technical concepts clearly to both technical and non-technical stakeholders.
Take ownership of project outcomes in a fast-paced, startup environment.

Qualifications & Experience

6+ years in ML engineering, with a focus on information retrieval, embedding systems, or data annotation pipelines.
Proven track record building scalable indexing and search infrastructure, including vector stores and similarity search algorithms.
Expertise in Python and PyTorch for core model development; hands-on experience with Hugging Face Transformers for multimodal embeddings and fine-tuning.
Working experience with video, computer vision, and multi-modal LLMs.
Hands-on experience deploying models in production environments and measuring model accuracy.
Proficiency in ML ops tools (e.g., MLflow, Weights & Biases) for experimentation, versioning, and deployment.
Hands-on experience with production ML deployment, evaluation metrics for retrieval/annotation tasks, and cost-optimized scaling on cloud platforms like AWS.
Strong analytical skills for dissecting performance in large distributed systems; familiarity with multi-GPU training and vector databases preferred.
Excellent communication to bridge technical depth with strategic priorities in collaborative settings.

Nice to Have

Prior experience training video models or working with video-based datasets.
Demonstrated expertise in GPU optimization and large-scale compute performance tuning.
A blend of startup agility and big tech rigor.
Contributions to open source development and projects
Experience working with search ranking algorithms.

Location & Compensation

Location: Strong preference for candidates based in the San Francisco Bay Area.
Compensation: $200,000 - $400,000 base salary + equity.

Why Join Troveo?

Work at the cutting edge of AI, video, and large-scale data infrastructure.
Build systems that directly power the next generation of AI video models.
Collaborate with a world-class team of engineers, researchers, and industry experts.
High autonomy, high impact, your work will shape the foundation of our platform.
Competitive compensation with meaningful equity upside.

In Summary: Troveo offers the world's largest library of AI video training data, featuring millions of hours of licensed video content . The Senior Machine Learning Engineer will play a central role in designing, building, and optimizing large-scale machine learning pipelines for AI video model training .

En Español: Sobre Troveo

Troveo está construyendo la próxima generación de plataformas de datos para capacitar modelos de vídeo AI. Trveo ofrece la biblioteca más grande del mundo de datos de capacitación de video IA, con millones de horas de contenido de video licenciado. Nuestra línea de datos extremo a extremo conecta creadores, titulares de derechos y laboratorios de investigación AI, lo que permite usos escalables, compatibles e innovadores del video en todas partes para aplicaciones y desarrollo de modelos AI.

Somos una empresa en fase inicial, de alto crecimiento respaldada por inversionistas con visión de futuro y estamos buscando un ingeniero estratégico innovador que nos ayude a escalar.

Una descripción general del papel

El Ingeniero Superior de Aprendizaje Automático desempeñará un papel central en el diseño, construcción y optimización de tuberías de aprendizaje automático a gran escala para la capacitación de modelos de vídeo AI. Trabajará durante todo el ciclo de vida del ML, desde estructurar conjuntos masivos de datos hasta desplegar, evaluar y capacitar modelos en producción.

Este es un papel práctico y de alto impacto para un ingeniero que prospera en escala, autonomía y colaboración interfuncional. Combinará una profunda experiencia técnica con una fuerte comunicación y perspicacia empresarial, traduciendo los modelos en costos medibles, objetivos de rendimiento y resultados del mundo real.

Responsabilidades clave

Proyectos de codificación y indexación de datos

Arquitectar e implementar tuberías a gran escala para la ingestión de vídeo, extracción de metadatos y indexación utilizando bases de datos vectoriales y modelos integrados para permitir una recuperación semántica rápida.
Diseñar flujos de trabajo de anotaciones que integran el aprendizaje activo, la supervisión débil y los sistemas humanos en circuito para curar conjuntos de datos etiquetados de alta calidad para modelos de video.
Contribuir a optimizar las estrategias de partición, fragmentación y almacenamiento en caché de datos para manejar corporales de video a escala de petabyte, asegurando una búsqueda con baja latencia y un linaje robusto de datos.

Formación y evaluación de modelos

Desarrollar y ajustar los modelos multimodal (por ejemplo, variantes CLIP, codificadores basados en transformador) para las incorporaciones de video, la segmentación de escena y el ranking de relevancia utilizando PyTorch y Hugging Face.
Construir marcos de evaluación con métricas como NDCG, mAP y puntuaciones de consistencia de anotación para mejorar iterativamente la precisión de búsqueda y la eficiencia de anotación.
Implementar modelos a través de servicios contenedores con pruebas A/B y monitoreo para la detección de deriva en las tuberías de búsqueda y anotación de producción.
Colaborar con los equipos de productos y operaciones para traducir el rendimiento del ML en conocimientos empresariales e implicaciones de costes.

Infraestructura y optimización

Escala de la infraestructura ML en AWS, aprovechando los clusters multi-GPU y capacitación distribuida para acelerar las tareas de computación e indexación integradas.
Implementar procesos de prueba y despliegue en grandes sistemas distribuidos. Modelos OSS afinados.
Implementar CI / CD automatizado para la versión de modelos, sintonización de hiperparámetros y orquestación de recursos para minimizar los costos computacionales y maximizar la utilización de GPU.
Sistemas de perfil y sintonía para cuellos de botella en la búsqueda de similitudes vectoriales, anotación por lotes y consulta en tiempo real.

Colaboración interfuncional

Colaborar con equipos de productos, investigaciones y datos para alinear las salidas ML con los KPIs empresariales, como objetivos de latencia en la búsqueda y rendimiento de anotaciones.
Transformar las compensaciones técnicas (por ejemplo, recuerdo vs precisión en embeddings) en ideas prácticas para los interesados, fomentando la adopción de características de descubrimiento de vídeo.
Trabajar en estrecha colaboración con ingenieros de datos, científicos de investigación y equipos de productos para alinear el rendimiento del modelo con los objetivos estratégicos del negocio.
Comunicar claramente los conceptos técnicos a las partes interesadas técnicas y no técnicas.
Tomar la responsabilidad de los resultados del proyecto en un entorno rápido y emergente.

Qualificaciones y experiencia

6+ años en ingeniería ML, con un enfoque en la extracción de información, sistemas integrados o tuberías de anotación de datos.
Un historial comprobado en la construcción de una infraestructura escalable de indexación y búsqueda, incluidas las tiendas vectoriales y los algoritmos de búsquedas de similitudes.
Experiencia en Python y PyTorch para el desarrollo de modelos básicos; experiencia práctica con Hugging Face Transformers para incorporaciones multimodal y ajuste fino.
Experiencia laboral con video, visión por ordenador y LLM multimodal.
Experiencia práctica en el despliegue de modelos en entornos de producción y medición de la precisión del modelo.
Proficiencia en las herramientas de operaciones ML (por ejemplo, MLflow, Weights & Biases) para la experimentación, versión y despliegue.
Experiencia práctica con el despliegue de ML en producción, métricas de evaluación para tareas de extracción/anomenación y escalado optimizado de costos en plataformas cloud como AWS.
Fuertes habilidades analíticas para diseccionar el rendimiento en grandes sistemas distribuidos; familiaridad con la formación multi-GPU y bases de datos vectoriales preferidas.
Excelente comunicación para unir la profundidad técnica con las prioridades estratégicas en entornos de colaboración.

Qué bueno tenerlo .

Experiencia previa en la formación de modelos de vídeo o trabajando con conjuntos de datos basados en video.
Experiencia demostrada en optimización de GPU y ajuste del rendimiento computacional a gran escala.
Una mezcla de agilidad para startups y rigor tecnológico.
Contribuciones al desarrollo y a los proyectos de código abierto
Experiencia trabajando con algoritmos de clasificación de búsqueda.

Localización y compensación

Localización: Una fuerte preferencia para los candidatos basados en el área de la bahía de San Francisco.
Compensación: $200,000 - $400,000 salario base + capital.

¿Por qué unirse a Troveo?

Trabajar en la vanguardia de IA, video y infraestructura de datos a gran escala.
Construir sistemas que impulsen directamente la próxima generación de modelos de vídeo AI.
Colaborar con un equipo de ingenieros, investigadores y expertos en la industria.
Alta autonomía, alto impacto, su trabajo formará la base de nuestra plataforma.
Compensación competitiva con una ventaja significativa de la renta variable.