
Trypulse is hiring: Machine Learning Engineer in San Francisco
Trypulse, San Francisco, CA, United States
Overview
Pulse is tackling one of the most persistent challenges in data infrastructure: extracting accurate, structured information from complex documents at scale. We have a breakthrough approach to document understanding that combines intelligent schema mapping with fine-tuned extraction models where legacy OCR and other parsing tools consistently fail.
We are a small, fast-growing team of engineers in San Francisco powering Fortune 100 enterprises, YC startups, public investment firms, and growth-stage companies. We are backed by tier 1 investors and growing quickly.
What makes our tech special is our multi-stage architecture:
Layout understanding with specialized component detection models
Low-latency OCR models for targeted extraction
Advanced reading-order algorithms for complex structures
Proprietary table structure recognition and parsing
Fine-tuned vision-language models for charts, tables, and figures
If you are passionate about the intersection of computer vision, NLP, and data infrastructure, your work at Pulse will directly impact customers and shape the future of document intelligence.
What we are looking for
5 days in-office at our San Francisco office
Eager to learn and adapt quickly
Prior startup or founding experience is a plus
About the Role
Create the specialized vision and language models that power Pulse. You will have autonomy to train and fine-tune models and to ship improvements to production.
Responsibilities
Train and fine tune OCR, layout, table, and vision-language models
Build evaluation, data curation, and active learning pipelines
Optimize inference, batching, and quantization on GPU
Productionize models with clear SLAs and rollback plans
Write internal notes that inform model and product roadmaps
Requirements
3+ years in applied ML or research, or strong open source record
PyTorch or JAX, and modern vision or multimodal architectures
Solid engineering discipline and metrics focus
Nice to have
Triton Inference Server, TensorRT, ONNX, distributed training
Sponsorship
Sponsorship available.
Compensation and benefits
Competitive base salary plus equity, performance-based bonus, relocation assistance for Bay Area moves, daily meal stipend, medical, vision, and dental coverage.
#J-18808-Ljbffr
In Summary: Pulse is tackling one of the most persistent challenges in data infrastructure: extracting accurate, structured information from complex documents at scale . We have a breakthrough approach to document understanding that combines intelligent schema mapping with fine-tuned extraction models . We are a small, fast-growing team of engineers in San Francisco powering Fortune 100 enterprises, YC startups, public investment firms, and growth-stage companies .
En Español: Overview Pulse está abordando uno de los desafíos más persistentes en la infraestructura de datos: extraer información precisa y estructurada de documentos complejos a gran escala. Tenemos un enfoque innovador para el entendimiento documental que combina mapeo inteligente del esquema con modelos de extracción afinados donde OCR heredado y otras herramientas de análisis fallan constantemente. Somos un pequeño equipo de ingenieros de crecimiento rápido en San Francisco impulsando las empresas Fortune 100, startups YC, firmas públicas de inversión y compañías en fase de desarrollo. Estamos respaldados por inversores de nivel 1 y creciendo rápidamente. Lo que hace nuestra arquitectura tecnológica especial es nuestro conocimiento multi-estadial: Layout con modelos especializados de extracciones de componentes Modelos OCR de baja latencia para extracción dirigida Algorithmos avanzados de orden de lectura avanzada para estructuras complejas Reconocimiento de tablas Propietarias y parsing Role-language para diseñar gráficos, si buscamos una visión rápida e interrelacionada de nuestros clientes, podemos aprender acerca de la estructura de las imágenes y la imagen de las piezas de trabajo, así como cómo se pueden adaptar las figuras de la inteligencia electrónica y la visión del futuro. Tendrá autonomía para entrenar y ajustar los modelos y enviar mejoras a la producción. Responsabilidades Entrenamiento y ajuste fino de OCR, diseño, tabla y modelos del lenguaje de visión Construir evaluación, curado de datos y oleoductos de aprendizaje activo Optimizar la inferencia, lotes y cuantización en GPU Produccionar modelos con SLA claros y planes de retroceso Escribir notas internas que informen el modelo y las hojas de ruta del producto Requisitos 3+ años en ML o investigación aplicada, o un sólido registro de código abierto PyTorch o JAX, y arquitecturas modernas de visión o multimodal Disciplina y métricas solidas se centran en tener Triton Inference Server, TensorRT, ONNX, patrocinadores de capacitación distribuidos Spons disponibles. Compensación y beneficios Competibilidad más equidad salarial básica, rendimiento-bonus, ayuda al traslado para movimientos médicos basados en Bay Area, recompensas diarias y visones dentales, #bjJr1880, vigo dental
Pulse is tackling one of the most persistent challenges in data infrastructure: extracting accurate, structured information from complex documents at scale. We have a breakthrough approach to document understanding that combines intelligent schema mapping with fine-tuned extraction models where legacy OCR and other parsing tools consistently fail.
We are a small, fast-growing team of engineers in San Francisco powering Fortune 100 enterprises, YC startups, public investment firms, and growth-stage companies. We are backed by tier 1 investors and growing quickly.
What makes our tech special is our multi-stage architecture:
Layout understanding with specialized component detection models
Low-latency OCR models for targeted extraction
Advanced reading-order algorithms for complex structures
Proprietary table structure recognition and parsing
Fine-tuned vision-language models for charts, tables, and figures
If you are passionate about the intersection of computer vision, NLP, and data infrastructure, your work at Pulse will directly impact customers and shape the future of document intelligence.
What we are looking for
5 days in-office at our San Francisco office
Eager to learn and adapt quickly
Prior startup or founding experience is a plus
About the Role
Create the specialized vision and language models that power Pulse. You will have autonomy to train and fine-tune models and to ship improvements to production.
Responsibilities
Train and fine tune OCR, layout, table, and vision-language models
Build evaluation, data curation, and active learning pipelines
Optimize inference, batching, and quantization on GPU
Productionize models with clear SLAs and rollback plans
Write internal notes that inform model and product roadmaps
Requirements
3+ years in applied ML or research, or strong open source record
PyTorch or JAX, and modern vision or multimodal architectures
Solid engineering discipline and metrics focus
Nice to have
Triton Inference Server, TensorRT, ONNX, distributed training
Sponsorship
Sponsorship available.
Compensation and benefits
Competitive base salary plus equity, performance-based bonus, relocation assistance for Bay Area moves, daily meal stipend, medical, vision, and dental coverage.
#J-18808-Ljbffr
In Summary: Pulse is tackling one of the most persistent challenges in data infrastructure: extracting accurate, structured information from complex documents at scale . We have a breakthrough approach to document understanding that combines intelligent schema mapping with fine-tuned extraction models . We are a small, fast-growing team of engineers in San Francisco powering Fortune 100 enterprises, YC startups, public investment firms, and growth-stage companies .
En Español: Overview Pulse está abordando uno de los desafíos más persistentes en la infraestructura de datos: extraer información precisa y estructurada de documentos complejos a gran escala. Tenemos un enfoque innovador para el entendimiento documental que combina mapeo inteligente del esquema con modelos de extracción afinados donde OCR heredado y otras herramientas de análisis fallan constantemente. Somos un pequeño equipo de ingenieros de crecimiento rápido en San Francisco impulsando las empresas Fortune 100, startups YC, firmas públicas de inversión y compañías en fase de desarrollo. Estamos respaldados por inversores de nivel 1 y creciendo rápidamente. Lo que hace nuestra arquitectura tecnológica especial es nuestro conocimiento multi-estadial: Layout con modelos especializados de extracciones de componentes Modelos OCR de baja latencia para extracción dirigida Algorithmos avanzados de orden de lectura avanzada para estructuras complejas Reconocimiento de tablas Propietarias y parsing Role-language para diseñar gráficos, si buscamos una visión rápida e interrelacionada de nuestros clientes, podemos aprender acerca de la estructura de las imágenes y la imagen de las piezas de trabajo, así como cómo se pueden adaptar las figuras de la inteligencia electrónica y la visión del futuro. Tendrá autonomía para entrenar y ajustar los modelos y enviar mejoras a la producción. Responsabilidades Entrenamiento y ajuste fino de OCR, diseño, tabla y modelos del lenguaje de visión Construir evaluación, curado de datos y oleoductos de aprendizaje activo Optimizar la inferencia, lotes y cuantización en GPU Produccionar modelos con SLA claros y planes de retroceso Escribir notas internas que informen el modelo y las hojas de ruta del producto Requisitos 3+ años en ML o investigación aplicada, o un sólido registro de código abierto PyTorch o JAX, y arquitecturas modernas de visión o multimodal Disciplina y métricas solidas se centran en tener Triton Inference Server, TensorRT, ONNX, patrocinadores de capacitación distribuidos Spons disponibles. Compensación y beneficios Competibilidad más equidad salarial básica, rendimiento-bonus, ayuda al traslado para movimientos médicos basados en Bay Area, recompensas diarias y visones dentales, #bjJr1880, vigo dental