Buscamos un/a ML Video / AI Engineer para unirse a un equipo técnico especializado en el desarrollo de soluciones avanzadas de procesamiento de vídeo y audio basadas en IA. La persona seleccionada participará en el diseño, entrenamiento, despliegue y optimización de modelos de Machine Learning en producción, trabajando con arquitecturas backend escalables y orientadas a eventos.
Responsabilidades
* Diseñar y desarrollar pipelines de procesamiento de audio y vídeo basados en Machine Learning.
* Entrenar, ajustar y desplegar modelos usando Python y frameworks ML (PyTorch, HuggingFace Transformers).
* Implementar soluciones de speech/audio ML (transcripción, diarización, separación de audio, VAD, etc.).
* Optimizar inferencia en entornos GPU / CUDA y mejorar el rendimiento en producción.
* Integrar modelos de IA a través de APIs externas (OpenAI, Gemini, ElevenLabs, entre otras).
* Desarrollar y mantener servicios backend en Node.js / TypeScript con NestJS.
* Construir sistemas event-driven usando colas de mensajería (RabbitMQ).
* Contenerizar aplicaciones con Docker y desplegarlas en Kubernetes (GKE).
* Trabajar en Google Cloud Platform usando servicios como Cloud Storage, Cloud Functions y Compute Engine.
* Colaborar en pipelines de CI/CD (GitHub Actions).
* Aplicar principios de Domain-Driven Design y Clean Architecture.
Requisitos técnicos
* Experiencia sólida como AI Backend Engineer / ML Engineer.
* Dominio de Python y PyTorch u otros frameworks de ML.
* Experiencia con HuggingFace Transformers.
* Conocimiento práctico de librerías de audio/speech como:
* WhisperX
* pyannote
* SpeechBrain
* Experiencia en procesamiento de audio (WAV/MP3, VAD, separación de fuentes).
* Conocimientos en optimización de inferencia y uso de GPU.
* Experiencia con Docker y Kubernetes (idealmente GKE).
* Conocimientos de RabbitMQ y arquitecturas orientadas a eventos.
* Experiencia en Google Cloud Platform.
* Desarrollo backend con Node.js / TypeScript y NestJS.
* Experiencia integrando APIs de IA.
* Prácticas de CI/CD con GitHub Actions.
Se valorará
* Experiencia previa en productos de video, media o speech-to-text.
* Conocimiento en arquitecturas distribuidas y escalables.
* Experiencia trabajando en entornos de alto volumen de datos.
* Mentalidad de producto y foco en calidad y rendimiento.
Qué ofrecemos
* Proyectos punteros en IA aplicada a vídeo y audio.
* Flexibilidad horaria y modelo de trabajo híbrido con 1 día de oficina/semana.
* Salario competitivo acorde a experiencia.