AI Squared is hiring: Data Scientist in Washington

AI Squared, Washington, DC, United States

Overview

We are looking for a highly motivated Data Scientist with a strong background in applied machine learning and AI to join our growing team. In this role, you will be a key contributor to the development of core AI/ML solutions that power our platform. You will collaborate closely with product and engineering teams, applying state-of-the-art techniques to solve complex challenges, advance our use of large language models (LLMs), and ensure scalable, production-ready solutions.

Responsibilities

Leverage 5+ years of experience in data science to design, implement, and optimize machine learning models and pipelines.
Develop, fine-tune, and evaluate large language models (LLMs) for a variety of applications, ensuring accuracy, performance, and robustness.
Collaborate with engineering and product teams to integrate AI/ML solutions into our platform in a scalable and maintainable way.
Conduct applied research, staying current on advances in LLMs, generative AI, and data science methodologies, and translate them into practical solutions.
Build end-to-end workflows, from data exploration and feature engineering to training, validation, deployment, and monitoring in production.
Apply modern containerization and orchestration techniques (e.g., Docker, Kubernetes) to support reproducible experimentation and deployment.
Work with cloud platforms (e.g., Databricks, AWS, GCP, Azure) to manage data pipelines, large-scale training jobs, and distributed systems.
Collaborate across teams to ensure our AI capabilities align with platform goals and business needs.

Qualifications

5+ years of experience as a Data Scientist or Machine Learning Engineer, with proven success in deploying models to production.
Hands-on experience with large language models (LLMs); fine-tuning experience strongly preferred.
Strong background in Python and ML frameworks such as PyTorch or TensorFlow.
Proficiency in containerization and orchestration technologies (Docker, Kubernetes).
Experience with cloud platforms and ML ecosystems (Databricks, AWS, GCP, Azure).
Familiarity with MLOps best practices, including model deployment, monitoring, and CI/CD for ML.
Strong analytical and problem-solving skills, with the ability to translate research into production-ready solutions.
Excellent communication and collaboration skills, with the ability to work effectively across product, engineering, and leadership teams.
A proactive, self-starter mindset with a passion for applied research and innovation.

#J-18808-Ljbffr

En Español:

Presentación general

Buscamos a un científico de datos altamente motivado con una sólida experiencia en aprendizaje automático aplicado y IA para unirse a nuestro creciente equipo. En este papel, usted será un contribuyente clave al desarrollo de soluciones básicas de IA / ML que impulsan nuestra plataforma. Colaborará estrechamente con equipos de producto e ingeniería, aplicando técnicas de vanguardia para resolver desafíos complejos, avanzar en nuestro uso de modelos de lenguaje grandes (LLM) y garantizar soluciones escalables y listas para la producción.

Responsabilidades

Aprovechar más de 5 años de experiencia en ciencia de datos para diseñar, implementar y optimizar modelos y tuberías de aprendizaje automático.
Desarrollar, ajustar y evaluar modelos de lenguaje grande (LLM) para una variedad de aplicaciones, asegurando precisión, rendimiento y robustez.
Colaborar con equipos de ingeniería y productos para integrar soluciones de IA/ML en nuestra plataforma de una manera escalable y mantenible.
Realizar investigaciones aplicadas, mantenerse al día sobre los avances en LLM, IA generativa y metodologías de ciencia de datos, y traducirlas en soluciones prácticas.
Construir flujos de trabajo de extremo a extremo, desde la exploración de datos e ingeniería de características hasta la capacitación, validación, despliegue y monitoreo en la producción.
Aplicar técnicas modernas de contenerización y orquestación (por ejemplo, Docker, Kubernetes) para apoyar la experimentación y el despliegue reproducibles.
Trabajar con plataformas en la nube (por ejemplo, Databricks, AWS, GCP, Azure) para gestionar tuberías de datos, trabajos de capacitación a gran escala y sistemas distribuidos.
Colaborar entre equipos para garantizar que nuestras capacidades de IA se alineen con los objetivos de la plataforma y las necesidades del negocio.

Qualificaciones

5+ años de experiencia como científico de datos o ingeniero de aprendizaje automático, con éxito comprobado en la implementación de modelos en producción.
Experiencia práctica con grandes modelos lingüísticos (LLM); experiencia de ajuste fino es muy preferida.
Fuertes antecedentes en Python y marcos ML como PyTorch o TensorFlow.
Proficiencia en tecnologías de contenerización y orquestación (Docker, Kubernetes).
Experiencia con plataformas en la nube y ecosistemas ML (Databricks, AWS, GCP, Azure).
Familiarización con las mejores prácticas de los MLOP, incluida la implementación de modelos, el seguimiento y el CI/CD para ML.
Fuertes habilidades analíticas y de resolución de problemas, con la capacidad de traducir la investigación en soluciones listas para la producción.
Excelentes habilidades de comunicación y colaboración, con la capacidad de trabajar eficazmente en equipos de producto, ingeniería y liderazgo.
Una mentalidad proactiva y autoiniciativa con pasión por la investigación aplicada y la innovación.

#J-18808-Ljbffr