Buscamos un/a ML Video / AI Engineer para unirse a un equipo técnico especializado en el desarrollo de soluciones avanzadas de procesamiento de vídeo y audio basadas en IA. La persona seleccionada participará en el diseño, entrenamiento, despliegue y optimización de modelos de Machine Learning en producción, trabajando con arquitecturas backend escalables y orientadas a eventos.
Responsabilidades
- Diseñar y desarrollar pipelines de procesamiento de audio y vídeo basados en Machine Learning.
- Entrenar, ajustar y desplegar modelos usando Python y frameworks ML (PyTorch, HuggingFace Transformers).
- Implementar soluciones de speech/audio ML (transcripción, diarización, separación de audio, VAD, etc.).
- Optimizar inferencia en entornos GPU / CUDA y mejorar el rendimiento en producción.
- Integrar modelos de IA a través de APIs externas (OpenAI, Gemini, ElevenLabs, entre otras).
- Desarrollar y mantener servicios backend en Node.js / TypeScript con NestJS.
- Construir sistemas event-driven usando colas de mensajería (RabbitMQ).
- Contenerizar aplicaciones con Docker y desplegarlas en Kubernetes (GKE).
- Trabajar en Google Cloud Platform usando servicios como Cloud Storage, Cloud Functions y Compute Engine.
- Colaborar en pipelines de CI/CD (GitHub Actions).
- Aplicar principios de Domain-Driven Design y Clean Architecture.
Requisitos técnicos
- Experiencia sólida como AI Backend Engineer / ML Engineer.
- Dominio de Python y PyTorch u otros frameworks de ML.
- Experiencia con HuggingFace Transformers.
- Conocimiento práctico de librerías de audio/speech como:
- WhisperX
- pyannote
- SpeechBrain
- Experiencia en procesamiento de audio (WAV/MP3, VAD, separación de fuentes).
- Conocimientos en optimización de inferencia y uso de GPU.
- Experiencia con Docker y Kubernetes (idealmente GKE).
- Conocimientos de RabbitMQ y arquitecturas orientadas a eventos.
- Experiencia en Google Cloud Platform.
- Desarrollo backend con Node.js / TypeScript y NestJS.
- Experiencia integrando APIs de IA.
- Prácticas de CI/CD con GitHub Actions.
Se valorará
- Experiencia previa en productos de video, media o speech-to-text.
- Conocimiento en arquitecturas distribuidas y escalables.
- Experiencia trabajando en entornos de alto volumen de datos.
- Mentalidad de producto y foco en calidad y rendimiento.
Qué ofrecemos
- Proyectos punteros en IA aplicada a vídeo y audio.
- Flexibilidad horaria y modelo de trabajo híbrido con 1 día de oficina/semana.
- Remuneración competitiva acorde a experiencia.