Buscamos un/a
Descubra exactamente qué habilidades, experiencia y cualificaciones necesitará para tener éxito en este puesto antes de enviar su solicitud a continuación.
ML Video / AI Engineer
para unirse a un equipo técnico especializado en el desarrollo de soluciones avanzadas de
procesamiento de vídeo y audio basadas en IA. La persona seleccionada participará en el diseño, entrenamiento, despliegue y optimización de modelos de Machine Learning en producción, trabajando con arquitecturas backend escalables y orientadas a eventos.
Responsabilidades
Diseñar y desarrollar pipelines de procesamiento de audio y vídeo basados en Machine Learning.
Entrenar, ajustar y desplegar modelos usando Python y frameworks ML (PyTorch, HuggingFace Transformers).
Implementar soluciones de speech/audio ML (transcripción, diarización, separación de audio, VAD, etc.).
Optimizar inferencia en entornos GPU / CUDA y mejorar el rendimiento en producción.
Integrar modelos de IA a través de APIs externas (OpenAI, Gemini, ElevenLabs, entre otras).
Desarrollar y mantener servicios backend en Node.Js / TypeScript con NestJS.
Construir sistemas event-driven usando colas de mensajería (RabbitMQ).
Contenerizar aplicaciones con Docker y desplegarlas en Kubernetes (GKE).
Trabajar en Google Cloud Platform usando servicios como Cloud Storage, Cloud Functions y Compute Engine.
Colaborar en pipelines de CI/CD (GitHub Actions).
Aplicar principios de Domain-Driven Design y Clean Architecture.
Requisitos técnicos
Experiencia sólida como AI Backend Engineer / ML Engineer.
Dominio de Python y PyTorch u otros frameworks de ML.
Experiencia con HuggingFace Transformers.
Conocimiento práctico de librerías de audio/speech como:
WhisperX
pyannote
SpeechBrain
Experiencia en procesamiento de audio (WAV/MP3, VAD, separación de fuentes).
Conocimientos en optimización de inferencia y uso de GPU.
Experiencia con Docker y Kubernetes (idealmente GKE).
Conocimientos de RabbitMQ y arquitecturas orientadas a eventos.
Experiencia en Google Cloud Platform.
Desarrollo backend con Node.Js / TypeScript y NestJS.
Experiencia integrando APIs de IA.
Prácticas de CI/CD con GitHub Actions.
Se valorará
Experiencia previa en productos de video, media o speech-to-text.
Conocimiento en arquitecturas distribuidas y escalables.
Experiencia trabajando en entornos de alto volumen de datos.
Mentalidad de producto y foco en calidad y rendimiento.
Qué ofrecemos
Proyectos punteros en IA aplicada a vídeo y audio.
Flexibilidad horaria y modelo de trabajo híbrido con 1 día de oficina/semana. xhfqzwm
Salario competitivo acorde a experiencia.