
AI Squared is hiring: Data Scientist in Washington
AI Squared, Washington, DC, United States
Overview
We are looking for a highly motivated Data Scientist with a strong background in applied machine learning and AI to join our growing team. In this role, you will be a key contributor to the development of core AI/ML solutions that power our platform. You will collaborate closely with product and engineering teams, applying state-of-the-art techniques to solve complex challenges, advance our use of large language models (LLMs), and ensure scalable, production-ready solutions.
Responsibilities
- Leverage 5+ years of experience in data science to design, implement, and optimize machine learning models and pipelines.
- Develop, fine-tune, and evaluate large language models (LLMs) for a variety of applications, ensuring accuracy, performance, and robustness.
- Collaborate with engineering and product teams to integrate AI/ML solutions into our platform in a scalable and maintainable way.
- Conduct applied research, staying current on advances in LLMs, generative AI, and data science methodologies, and translate them into practical solutions.
- Build end-to-end workflows, from data exploration and feature engineering to training, validation, deployment, and monitoring in production.
- Apply modern containerization and orchestration techniques (e.g., Docker, Kubernetes) to support reproducible experimentation and deployment.
- Work with cloud platforms (e.g., Databricks, AWS, GCP, Azure) to manage data pipelines, large-scale training jobs, and distributed systems.
- Collaborate across teams to ensure our AI capabilities align with platform goals and business needs.
Qualifications
- 5+ years of experience as a Data Scientist or Machine Learning Engineer, with proven success in deploying models to production.
- Hands-on experience with large language models (LLMs); fine-tuning experience strongly preferred.
- Strong background in Python and ML frameworks such as PyTorch or TensorFlow.
- Proficiency in containerization and orchestration technologies (Docker, Kubernetes).
- Experience with cloud platforms and ML ecosystems (Databricks, AWS, GCP, Azure).
- Familiarity with MLOps best practices, including model deployment, monitoring, and CI/CD for ML.
- Strong analytical and problem-solving skills, with the ability to translate research into production-ready solutions.
- Excellent communication and collaboration skills, with the ability to work effectively across product, engineering, and leadership teams.
- A proactive, self-starter mindset with a passion for applied research and innovation.
#J-18808-Ljbffr
En Español:
Presentación general
Buscamos a un científico de datos altamente motivado con una sólida experiencia en aprendizaje automático aplicado y IA para unirse a nuestro creciente equipo. En este papel, usted será un contribuyente clave al desarrollo de soluciones básicas de IA / ML que impulsan nuestra plataforma. Colaborará estrechamente con equipos de producto e ingeniería, aplicando técnicas de vanguardia para resolver desafíos complejos, avanzar en nuestro uso de modelos de lenguaje grandes (LLM) y garantizar soluciones escalables y listas para la producción.
Responsabilidades
- Aprovechar más de 5 años de experiencia en ciencia de datos para diseñar, implementar y optimizar modelos y tuberías de aprendizaje automático.
- Desarrollar, ajustar y evaluar modelos de lenguaje grande (LLM) para una variedad de aplicaciones, asegurando precisión, rendimiento y robustez.
- Colaborar con equipos de ingeniería y productos para integrar soluciones de IA/ML en nuestra plataforma de una manera escalable y mantenible.
- Realizar investigaciones aplicadas, mantenerse al día sobre los avances en LLM, IA generativa y metodologías de ciencia de datos, y traducirlas en soluciones prácticas.
- Construir flujos de trabajo de extremo a extremo, desde la exploración de datos e ingeniería de características hasta la capacitación, validación, despliegue y monitoreo en la producción.
- Aplicar técnicas modernas de contenerización y orquestación (por ejemplo, Docker, Kubernetes) para apoyar la experimentación y el despliegue reproducibles.
- Trabajar con plataformas en la nube (por ejemplo, Databricks, AWS, GCP, Azure) para gestionar tuberías de datos, trabajos de capacitación a gran escala y sistemas distribuidos.
- Colaborar entre equipos para garantizar que nuestras capacidades de IA se alineen con los objetivos de la plataforma y las necesidades del negocio.
Qualificaciones
- 5+ años de experiencia como científico de datos o ingeniero de aprendizaje automático, con éxito comprobado en la implementación de modelos en producción.
- Experiencia práctica con grandes modelos lingüísticos (LLM); experiencia de ajuste fino es muy preferida.
- Fuertes antecedentes en Python y marcos ML como PyTorch o TensorFlow.
- Proficiencia en tecnologías de contenerización y orquestación (Docker, Kubernetes).
- Experiencia con plataformas en la nube y ecosistemas ML (Databricks, AWS, GCP, Azure).
- Familiarización con las mejores prácticas de los MLOP, incluida la implementación de modelos, el seguimiento y el CI/CD para ML.
- Fuertes habilidades analíticas y de resolución de problemas, con la capacidad de traducir la investigación en soluciones listas para la producción.
- Excelentes habilidades de comunicación y colaboración, con la capacidad de trabajar eficazmente en equipos de producto, ingeniería y liderazgo.
- Una mentalidad proactiva y autoiniciativa con pasión por la investigación aplicada y la innovación.
#J-18808-Ljbffr