
Staff Machine Learning Engineer Job at Cisco Systems in San Francisco
Cisco Systems, San Francisco, CA, United States
Meet the Team Join the engineering team building the intelligent backbone of Splunk Observability Cloud. We are committed to leveraging the latest advancements in data science and machine learning to unlock unprecedented value from massive volumes of telemetry—metrics, traces, and logs—at petabyte scale. This role involves researching, developing, and deploying core analytical components focused on streaming anomaly detection, predictive intelligence, and automated root‑cause analysis. If you thrive on the challenge of building enterprise‑grade, scalable ML systems and applying sophisticated techniques to complex, high‑impact problems, you will be instrumental in delivering the full‑stack, real‑time answers and automation required for our customers to achieve true digital resilience across any cloud‑native or hybrid environment.
Your Impact Apply the latest Generative AI and Agentic AI to enable AI features in Splunk Observability
Collaborate across engineering and product teams to establish robust frameworks for evaluating AI systems’ trustworthiness and resilience.
Provide technical leadership and mentorship within the team, establishing leading practices for development, testing, and artifact management.
Minimum Qualifications Master’s degree in computer science or related field and 7+ years of software engineering experience, or bachelor’s degree with 10+ years of experience.
Experience designing and building scalable cloud‑based systems (AWS, Azure, or GCP), including container orchestration (e.g., Kubernetes, Docker).
Proven experience in technical leadership, architecture design, and end‑to‑end feature ownership in AI/ML or platform domains.
Experience with API design and frameworks (e.g. OpenAPI, GraphQL, gRPC, REST, etc.)
Prior working experience in delivering RAG and Agentic products into production
Expert at using vibe coding tools (Claude Code, Codex, Copilot, Windsurf, Cursor) is a must
Up To Date knowledge on the latest Agentic and Generative AI industry trend and framework
Preferred Qualifications Exceptional problem‑solving skills, with the ability to analyze complex requirements and propose effective solutions.
Experience developing, deploying, and maintaining applications in AWS environment with cloud native solutions.
Experience monitoring and analyzing metrics, trace, span, and log content
Background in observability, generative AI, or model robustness
Why Cisco? At Cisco, we’re revolutionizing how data and infrastructure connect and protect organizations in the AI era – and beyond. We’ve been innovating fearlessly for 40 years to create solutions that power how humans and technology work together across the physical and digital worlds. These solutions provide customers with unparalleled security, visibility, and insights across the entire digital footprint.
Fueled by the depth and breadth of our technology, we experiment and create meaningful solutions. Add to that our worldwide network of doers and experts, and you’ll see that the opportunities to grow and build are limitless. We work as a team, collaborating with empathy to make really big things happen on a global scale. Because our solutions are everywhere, our impact is everywhere.
We are Cisco, and our power starts with you.
Cisco is an Aff…
Cisco will consider for employment, on a case by case basis, qualified applicants with arrest and conviction records.
#J-18808-Ljbffr
In Summary: Join the engineering team building the intelligent backbone of Splunk Observability Cloud . We are committed to leveraging the latest advancements in data science and machine learning to unlock unprecedented value from massive volumes of telemetry . This role involves researching, developing, and deploying core analytical components focused on streaming anomaly detection, predictive intelligence, and automated root‑cause analysis .
En Español: Unirse al equipo de ingeniería que construye la espina dorsal inteligente de Splunk Observability Cloud. Estamos comprometidos a aprovechar los últimos avances en ciencia de datos y aprendizaje automático para desbloquear un valor sin precedentes de grandes volúmenes de telemetría, métricas, rastros y registros a escala de petabytes. Esta función implica investigar, desarrollar e implementar componentes analíticos centrales centrados en la detección de anomalías de transmisión, inteligencia predictiva y análisis automatizado de causas raíz. Si se aprovecha el desafío de construir sistemas de inteligencia artificial escalables a nivel empresarial y aplicar técnicas sofisticadas a problemas complejos de alto impacto, será fundamental para ofrecer las respuestas completas en tiempo real y la automatización necesarias para que nuestros clientes logren una verdadera resiliencia digital en cualquier entorno nativo o híbrido. Su Impacto Aplicar la última IA generativa y AI agencial para permitir características de IA en Splunk Observability Colaborar entre equipos de ingeniería y productos para establecer marcos sólidos para evaluar la confiabilidad y resistencia de los sistemas de IA. Proporcionar liderazgo técnico y tutoría dentro del equipo, estableciendo prácticas líderes para desarrollo, pruebas y gestión de artefactos. Máster Minimum Qualifications en ciencias informáticas o campos relacionados y 7 años de experiencia en ingeniería de software, o licenciatura con más de 10 años. Experiencia en diseño y construcción de soluciones tecnológicas basados en tecnología (API), arquitectura de nube, diseño de piezas y plataformas digitales, incluida la experiencia técnica en diseñar y ejecutar estructuras de código abierto/proyectónico (e.g., Protecnología). OpenAPI, GraphQL, gRPC, REST, etc.) Experiencia laboral previa en la entrega de productos RAG y Agentic a la producción Experto en el uso de herramientas de codificación de vibración (Claude Code, Codex, Copilot, Windsurf, Cursor) es un conocimiento actualizado sobre las últimas tendencias de la industria de inteligencia artificial agencial y generativa y marco Qualificaciones preferidas Habilidades excepcionales para resolver problemas con capacidad de analizar requisitos complejos y soluciones efectivas. Desarrollar, implementar y mantener aplicaciones en entorno AWS con soluciones nativas en la nube Experiencia experimenta monitoreo y análisis de métricas, rastreo, extensión y contenido de registro Antecedentes en observabilidad, IA generacional o robustez de modelo ¿Por qué Cisco? Debido a que nuestras soluciones están en todas partes, nuestro impacto está en todos lados. Somos Cisco y nuestro poder comienza con ustedes. Cisco es un Aff... Cisco considerará para el empleo, caso por caso, solicitantes calificados con antecedentes de arresto y condena. #J-18808-Ljbffr
Your Impact Apply the latest Generative AI and Agentic AI to enable AI features in Splunk Observability
Collaborate across engineering and product teams to establish robust frameworks for evaluating AI systems’ trustworthiness and resilience.
Provide technical leadership and mentorship within the team, establishing leading practices for development, testing, and artifact management.
Minimum Qualifications Master’s degree in computer science or related field and 7+ years of software engineering experience, or bachelor’s degree with 10+ years of experience.
Experience designing and building scalable cloud‑based systems (AWS, Azure, or GCP), including container orchestration (e.g., Kubernetes, Docker).
Proven experience in technical leadership, architecture design, and end‑to‑end feature ownership in AI/ML or platform domains.
Experience with API design and frameworks (e.g. OpenAPI, GraphQL, gRPC, REST, etc.)
Prior working experience in delivering RAG and Agentic products into production
Expert at using vibe coding tools (Claude Code, Codex, Copilot, Windsurf, Cursor) is a must
Up To Date knowledge on the latest Agentic and Generative AI industry trend and framework
Preferred Qualifications Exceptional problem‑solving skills, with the ability to analyze complex requirements and propose effective solutions.
Experience developing, deploying, and maintaining applications in AWS environment with cloud native solutions.
Experience monitoring and analyzing metrics, trace, span, and log content
Background in observability, generative AI, or model robustness
Why Cisco? At Cisco, we’re revolutionizing how data and infrastructure connect and protect organizations in the AI era – and beyond. We’ve been innovating fearlessly for 40 years to create solutions that power how humans and technology work together across the physical and digital worlds. These solutions provide customers with unparalleled security, visibility, and insights across the entire digital footprint.
Fueled by the depth and breadth of our technology, we experiment and create meaningful solutions. Add to that our worldwide network of doers and experts, and you’ll see that the opportunities to grow and build are limitless. We work as a team, collaborating with empathy to make really big things happen on a global scale. Because our solutions are everywhere, our impact is everywhere.
We are Cisco, and our power starts with you.
Cisco is an Aff…
Cisco will consider for employment, on a case by case basis, qualified applicants with arrest and conviction records.
#J-18808-Ljbffr
In Summary: Join the engineering team building the intelligent backbone of Splunk Observability Cloud . We are committed to leveraging the latest advancements in data science and machine learning to unlock unprecedented value from massive volumes of telemetry . This role involves researching, developing, and deploying core analytical components focused on streaming anomaly detection, predictive intelligence, and automated root‑cause analysis .
En Español: Unirse al equipo de ingeniería que construye la espina dorsal inteligente de Splunk Observability Cloud. Estamos comprometidos a aprovechar los últimos avances en ciencia de datos y aprendizaje automático para desbloquear un valor sin precedentes de grandes volúmenes de telemetría, métricas, rastros y registros a escala de petabytes. Esta función implica investigar, desarrollar e implementar componentes analíticos centrales centrados en la detección de anomalías de transmisión, inteligencia predictiva y análisis automatizado de causas raíz. Si se aprovecha el desafío de construir sistemas de inteligencia artificial escalables a nivel empresarial y aplicar técnicas sofisticadas a problemas complejos de alto impacto, será fundamental para ofrecer las respuestas completas en tiempo real y la automatización necesarias para que nuestros clientes logren una verdadera resiliencia digital en cualquier entorno nativo o híbrido. Su Impacto Aplicar la última IA generativa y AI agencial para permitir características de IA en Splunk Observability Colaborar entre equipos de ingeniería y productos para establecer marcos sólidos para evaluar la confiabilidad y resistencia de los sistemas de IA. Proporcionar liderazgo técnico y tutoría dentro del equipo, estableciendo prácticas líderes para desarrollo, pruebas y gestión de artefactos. Máster Minimum Qualifications en ciencias informáticas o campos relacionados y 7 años de experiencia en ingeniería de software, o licenciatura con más de 10 años. Experiencia en diseño y construcción de soluciones tecnológicas basados en tecnología (API), arquitectura de nube, diseño de piezas y plataformas digitales, incluida la experiencia técnica en diseñar y ejecutar estructuras de código abierto/proyectónico (e.g., Protecnología). OpenAPI, GraphQL, gRPC, REST, etc.) Experiencia laboral previa en la entrega de productos RAG y Agentic a la producción Experto en el uso de herramientas de codificación de vibración (Claude Code, Codex, Copilot, Windsurf, Cursor) es un conocimiento actualizado sobre las últimas tendencias de la industria de inteligencia artificial agencial y generativa y marco Qualificaciones preferidas Habilidades excepcionales para resolver problemas con capacidad de analizar requisitos complejos y soluciones efectivas. Desarrollar, implementar y mantener aplicaciones en entorno AWS con soluciones nativas en la nube Experiencia experimenta monitoreo y análisis de métricas, rastreo, extensión y contenido de registro Antecedentes en observabilidad, IA generacional o robustez de modelo ¿Por qué Cisco? Debido a que nuestras soluciones están en todas partes, nuestro impacto está en todos lados. Somos Cisco y nuestro poder comienza con ustedes. Cisco es un Aff... Cisco considerará para el empleo, caso por caso, solicitantes calificados con antecedentes de arresto y condena. #J-18808-Ljbffr