
Research Engineer/Research Scientist, Audio Job at Menlo Ventures in San Francis
Menlo Ventures, San Francisco, CA, United States
About Anthropic
Anthropic’s mission is to create reliable, interpretable, and steerable AI systems. We want AI to be safe and beneficial for our users and for society as a whole. Our team is a quickly growing group of committed researchers, engineers, policy experts, and business leaders working together to build beneficial AI systems.
Anthropic’s Audio team pushes the boundaries of what's possible with audio with large language models. We care about making safe, steerable, reliable systems that can understand and generate speech and audio, prioritizing not only naturalness but also steerability and robustness. As a researcher on the Audio team, you'll work across the full stack of audio ML, developing audio codecs and representations, sourcing and synthesizing high quality audio data, training large-scale speech language models and large audio diffusion models, and developing novel architectures for incorporating continuous signals into LLMs.
Our team focuses primarily but not exclusively on speech, building advanced steerable systems spanning end-to-end conversational systems, speech and audio understanding models, and speech synthesis capabilities. The team works closely with many collaborators across pretraining, finetuning, reinforcement learning, production inference, and product to get advanced audio technologies from early research to high impact real-world deployments.
You may be a good fit if you:
- Have hands-on experience with training audio models, whether that's conversational speech-to-speech, speech translation, speech recognition, text-to-speech, diarization, codecs, or generative audio models
- Genuinely enjoy both research and engineering work, and you'd describe your ideal split as roughly 50/50 rather than heavily weighted toward one or the other
- Are comfortable working across abstraction levels, from signal processing fundamentals to large-scale model training and inference optimization
- Have deep expertise with JAX, PyTorch, or large-scale distributed training, and can debug performance issues across the full stack
- Thrive in fast-moving environments where the most important problem might shift as we learn more about what works
- Communicate clearly and collaborate effectively; audio touches many parts of our systems, so you'll work closely with teams across the company
- Are passionate about building conversational AI that feels natural, steerable, and safe
- Care about the societal impacts of voice AI and want to help shape how these systems are developed responsibly
Strong candidates may also have experience with:
- Large language model pretraining and finetuning
- Training diffusion models for image and audio generation
- Reinforcement learning for large language models and diffusion models
- End-to-end system optimization, from performance benchmarking to kernel optimization
- GPUs, Kubernetes, PyTorch, or distributed training infrastructure
Representative projects:
- Training state-of-the art neural audio codecs for 48 kHz stereo audio
- Developing novel algorithms for diffusion pretraining and reinforcement learning
- Scaling audio datasets to millions of hours of high quality audio
- Creating robust evaluation methodologies for hard-to-measure qualities such as naturalness or expressiveness
- Studying training dynamics of mixed audio-text language models
- Optimizing latency and inference throughput for deployed streaming audio systems
The annual compensation range for this role is below. For sales roles, the range provided is the role’s On Target Earnings ("OTE") range, meaning that the range includes both the sales commissions/sales bonuses target and annual base salary for the role. Our total compensation package for full-time employees includes equity and benefits.
Annual Salary: $350,000 – $500,000 USD
Logistics
Education requirements: We require at least a Bachelor's degree in a related field or equivalent experience.
Location-based hybrid policy: Currently, we expect all staff to be in one of our offices at least 25% of the time. However, some roles may require more time in our offices.
Visa sponsorship: We do sponsor visas! However, we aren't able to successfully sponsor visas for every role and every candidate. But if we make you an offer, we will make every reasonable effort to get you a visa, and we retain an immigration lawyer to help with this.
We encourage you to apply even if you do not believe you meet every single qualification. Not all strong candidates will meet every single qualification as listed. Research shows that people who identify as being from underrepresented groups are more prone to experiencing imposter syndrome and doubting the strength of their candidacy, so we urge you not to exclude yourself prematurely and to submit an application if you're interested in this work. We think AI systems like the ones we're building have enormous social and ethical implications. We think this makes representation even more important, and we strive to include a range of diverse perspectives on our team.
Your safety matters to us. To protect you from potential scams, remember that Anthropic recruiters only contact you from @anthropic.com email addresses. Be cautious of emails from other domains. Legitimate Anthropic recruiters will never ask for money, fees, or banking information before your first day. If you're ever unsure about a communication, don't click any links—visit anthropic.com/careers directly for confirmed position openings.
How we're different
We believe that the highest-impact AI research will be big science. At Anthropic we work as a single cohesive team on just a few large-scale research efforts. And we value impact — advancing our long-term goals of steerable, trustworthy AI — rather than work on smaller and more specific puzzles. We view AI research as an empirical science, which has as much in common with physics and biology as with traditional efforts in computer science. We're an extremely collaborative group, and we host frequent research discussions to ensure that we are pursuing the highest-impact work at any given time. As such, we greatly value communication skills.
The easiest way to understand our research directions is to read our recent research. This research continues many of the directions our team worked on prior to Anthropic, including: GPT-3, Circuit-Based Interpretability, Multimodal Neurons, Scaling Laws, AI & Compute, Concrete Problems in AI Safety, and Learning from Human Preferences.
Come work with us!
Anthropic is a public benefit corporation headquartered in San Francisco. We offer competitive compensation and benefits, optional equity donation matching, generous vacation and parental leave, flexible working hours, and a lovely office space in which to collaborate with colleagues. Guidance on Candidates' AI Usage: Learn about our policy for using AI in our application process
#J-18808-Ljbffr
En Español:
Sobre la Antropía
La misión de Anthropic es crear sistemas de IA fiables, interpretables y controlables. Queremos que la IA sea segura y beneficiosa para nuestros usuarios y para la sociedad en su conjunto. Nuestro equipo es un grupo de investigadores, ingenieros, expertos en políticas y líderes empresariales que trabajan juntos para construir sistemas de AI beneficiosos.
El equipo de Audio de Anthropic® empuja los límites de lo que es posible con el audio con grandes modelos de lenguaje. Nos preocupamos por hacer sistemas seguros, controlables y confiables que puedan entender y generar voz y audio, priorizando no solo la naturalidad sino también la direccionalidad y robustez. Como investigador en el equipo de audio, trabajará en toda la pila de audio ML, desarrollando códecs de audio y representaciones, obteniendo y sintetizando datos de audio de alta calidad, entrenando modelos de habla a gran escala y modelos de difusión de audio grandes, y desarrollando arquitecturas novedosas para incorporar señales continuas en LLMs.
Nuestro equipo se centra principalmente, pero no exclusivamente, en el habla, la construcción de sistemas directuales avanzados que abarcan sistemas de conversación de extremo a extremo, modelos de comprensión de voz y audio y capacidades de síntesis de voz. El equipo trabaja estrechamente con muchos colaboradores a través del preentrenamiento, ajuste fino, aprendizaje de refuerzo, inferencia de producción y producto para obtener tecnologías de audio avanzadas desde investigaciones tempranas hasta implementaciones de alto impacto en el mundo real.
Puede ser un buen ajuste si:
- Tener experiencia práctica con el entrenamiento de modelos de audio, ya sea conversación de habla a voz, traducción de la voz, reconocimiento de voz, texto a palabra, diarización, códec, o modelos generativos de audio
- Realmente disfruta tanto del trabajo de investigación como de ingeniería, y describiría su división ideal como aproximadamente 50/50 en lugar de pesadamente ponderado hacia uno u otro
- Son cómodos trabajando a través de los niveles de abstracción, desde los fundamentos del procesamiento de señales hasta la capacitación de modelos a gran escala y la optimización de inferencias
- Tener una profunda experiencia con JAX, PyTorch o capacitación distribuida a gran escala, y puede deshacerse de problemas de rendimiento en toda la pila
- Prosperar en entornos de rápido movimiento donde el problema más importante podría cambiar a medida que aprendemos más sobre lo que funciona
- Comunicarse con claridad y colaborar eficazmente; el audio toca muchas partes de nuestros sistemas, por lo que trabajará en estrecha colaboración con equipos de toda la empresa
- Son apasionados de construir una IA conversacional que se sienta natural, manejable y segura
- Se preocupan por los impactos sociales de la IA de voz y quieren ayudar a dar forma a cómo estos sistemas se desarrollan de manera responsable
Los candidatos fuertes también pueden tener experiencia en:
- Modelo de lenguaje de gran envergadura
- Formación de modelos de difusión para la generación de imágenes y audio
- Aprendizaje de refuerzo para modelos de idiomas grandes y modelos de difusión
- Optimización del sistema de extremo a extremo, desde el benchmarking de rendimiento hasta la optimización del núcleo
- GPUs, Kubernetes, PyTorch o infraestructura de capacitación distribuida
Proyectos representativos:
- Entrenamiento de códec de audio neuronal de última generación para audio estéreo de 48 kHz
- Desarrollo de nuevos algoritmos para el aprendizaje pre-entrenamiento y refuerzo de difusión
- Escalación de conjuntos de datos de audio a millones de horas de audio de alta calidad
- Crear metodologías de evaluación sólidas para las cualidades difíciles de medir, como la naturalidad o la expresividad
- Estudio de la dinámica de formación de modelos mixtos de lenguaje audio-texto
- Optimización de la latencia y el rendimiento de inferencia para los sistemas de audio de transmisión desplegados
El rango de compensación anual para este papel es el siguiente. Para las funciones de ventas, el rango proporcionado es el rollos On Target Earnings ("OTE") rango, lo que significa que la gama incluye tanto el objetivo de comisiones de venta / bonos de venta como el salario base anual para el papel. Nuestro paquete total de compensaciones para empleados a tiempo completo incluye equidad y beneficios.
Salario anual: $ 350.000 $ 500.000 USD
Logística
Requisitos educativos: Se requiere al menos una licenciatura en un campo relacionado o experiencia equivalente.
Política híbrida basada en la ubicación: Actualmente, esperamos que todo el personal esté en una de nuestras oficinas al menos el 25% del tiempo.
Patrocinio de visados: Sin embargo, no somos capaces de patrocinar con éxito las visas para cada puesto y cada candidato. Pero si le hacemos una oferta, haremos todos los esfuerzos razonables para obtener una visa, y retendremos un abogado de inmigración para ayudar con esto.
Te animamos a aplicar aunque no creas que cumplas todas las condiciones. La investigación muestra que las personas que se identifican como pertenecientes a grupos subrepresentados son más propensas a experimentar el síndrome del impostor y a dudar de la fortaleza de su candidatura, por lo que le instamos a no excluirse prematuramente y a presentar una solicitud si está interesado en este trabajo. Creemos que los sistemas de IA como los que estamos construyendo tienen enormes implicaciones sociales y éticas. Pensamos que esto hace que la representación sea aún más importante, y nos esforzamos por incluir una gama de perspectivas diversas en nuestro equipo.
Su seguridad es importante para nosotros. Para protegerse de posibles estafas, recuerde que los reclutadores de Anthropic solo se comunican con usted desde las direcciones de correo electrónico @anthropic.com. Tenga cuidado con los correos electrónicos de otros dominios. Los reclutantes legítimos de Antropic nunca le pedirán dinero, tarifas o información bancaria antes de su primer día. Si alguna vez no está seguro sobre una comunicación, no haga clic en ningún enlacevisitar anthropic. com/carrieres directamente para obtener oportunidades de empleo confirmadas.
Cómo somos diferentes
Creemos que la investigación de IA con mayor impacto será la ciencia grande. En Anthropic trabajamos como un único equipo cohesivo en solo unos pocos esfuerzos de investigación a gran escala. Y valoramos el impacto avanzar en nuestros objetivos a largo plazo de IA manejable y confiable en lugar de trabajar en rompecabezas más pequeñas y específicas. Consideramos la investigación AI como una ciencia empírica, que tiene tanto en común con la física y la biología como con los esfuerzos tradicionales en ciencias de la computación. Somos un grupo extremadamente colaborativo, y organizamos discusiones de investigación frecuentes para asegurarnos de que estamos realizando el trabajo de mayor impacto en un momento dado. Como tal, valoramos enormemente las habilidades de comunicación.
La forma más fácil de entender nuestras direcciones de investigación es leer nuestra investigación reciente. Esta investigación continúa muchas de las direcciones en las que nuestro equipo trabajó antes de Anthropic, incluyendo: GPT-3, Interpretabilidad basada en circuitos, neuronas multimodal, leyes de escala, IA y computación, problemas concretos en seguridad de IA y aprendizaje a partir de preferencias humanas.
Ven a trabajar con nosotros!
Anthropic es una corporación de beneficio público con sede en San Francisco. Ofrecemos compensación y beneficios competitivos, donaciones opcionales de equidad, vacaciones generosas y licencia parental, horas de trabajo flexibles y un hermoso espacio de oficina en el que colaborar con colegas. Orientación sobre el uso de IA por parte de los candidatos: Conozca nuestra política de uso de IA en nuestro proceso de solicitud
#J-18808-Ljbffr