Desde Laberit, y en colaboración con la startup Omniloy, una empresa innovadora con sede en Nueva York y Madrid, enfocada en revolucionar el sector sanitario mediante la implementación de sistemas de IA para automatizar tareas repetitivas y maximizar el uso de datos en hospitales, buscamos talento para unirse a nuestro equipo dinámico. Omniloy, fundada por dos emprendedores españoles, fomenta un entorno laboral flexible y adaptable, priorizando el bienestar y la productividad de las personas.
Buscamos un/a Desarrollador de Software Senior con experiencia para ayudar a construir, optimizar y escalar nuestro avanzado pipeline de IA voz-a-voz. Este sistema integra Reconocimiento Automático de Voz (ASR), Modelos de Lenguaje a Gran Escala (LLMs) y Síntesis de Voz (TTS) para habilitar experiencias avanzadas de IA conversacional. Liderarás esfuerzos técnicos para desplegar, mejorar y escalar este pipeline para decenas de miles de usuarios concurrentes.
¿Qué funciones principales llevarás a cabo?
* Diseñar, implementar y mantener un pipeline robusto de IA voz-a-voz utilizando tecnologías avanzadas de ASR, LLM y TTS.
* Optimizar modelos e infraestructura para garantizar escalabilidad, fiabilidad y baja latencia.
* Colaborar estrechamente con ingenieros de machine learning, científicos de datos y equipos de producto para mejorar las funcionalidades de IA conversacional y la experiencia del usuario.
* Evaluar e integrar modelos y tecnologías de código abierto y de terceros en el pipeline.
* Identificar cuellos de botella e implementar mejoras de rendimiento para escalar la plataforma de manera efectiva.
* Desarrollar pruebas automatizadas, monitoreo y registro de datos para garantizar la estabilidad y el rendimiento del sistema.
* Documentar la arquitectura del sistema, los procesos de despliegue y las mejores prácticas.
Requisitos Indispensables
* Más de 5 años de experiencia profesional en desarrollo de software, preferentemente con enfoque en sistemas en tiempo real y servicios backend escalables.
* Experiencia demostrada en la implementación de modelos de ASR (Reconocimiento Automático de Voz), LLM (Modelos de Lenguaje de Gran Escala) o TTS (Síntesis de Voz) en entornos de producción.
* Dominio de Python y familiaridad con frameworks como PyTorch, TensorFlow o Hugging Face.
* Experiencia en el despliegue y escalado de servicios utilizando plataformas en la nube (por ejemplo, AWS, GCP, Azure), Kubernetes y Docker.
* Sólido entendimiento de la arquitectura de microservicios, APIs REST y tecnologías de transmisión de datos (streaming).
* Excelentes habilidades para la resolución de problemas, gran atención al detalle y compromiso con la calidad y la optimización del rendimiento.
* Buenas habilidades de comunicación y capacidad para colaborar eficazmente en equipos interdisciplinarios.
Deseables
* Experiencia específica con pipelines de IA de voz a voz y agentes conversacionales en tiempo real.
* Experiencia práctica trabajando con Modelos de Lenguaje de Gran Escala (LLMs), incluyendo Langchain u otras bibliotecas relacionadas.
* Conocimientos de WebRTC, LiveKit, gRPC u otras tecnologías de comunicación en tiempo real.
* Experiencia en ajuste fino (fine-tuning) y optimización de LLMs para tareas específicas.
* Familiaridad con técnicas de optimización de modelos (cuantización, destilación) y aceleración por hardware (GPUs, TPUs).
* Experiencia previa escalando servicios para decenas de miles o millones de usuarios.
¿Qué ofrecemos?
* Salario competitivo
* Cultura remota desde el inicio, con horarios flexibles y tiempo libre; incluyendo el día de tu cumpleaños
* Oportunidad de trabajar con tecnología de IA de vanguardia que está transformando el sector de la salud
* Dos reuniones anuales presenciales con el equipo para conectar y divertirse
* Un equipo de trabajo ágil y solidario donde puedes desarrollar tus habilidades y aumentar tu impacto
* 5+ años de experiencia profesional en desarrollo de software, preferiblemente en sistemas en tiempo real y servicios backend escalables.
* Experiencia demostrada en despliegue de modelos ASR, LLM o TTS en entornos de producción.
* Dominio de Python y conocimiento de frameworks como PyTorch, TensorFlow o Hugging Face.
* Experiencia en el despliegue y escalado de servicios en plataformas en la nube (AWS, GCP, Azure) utilizando Kubernetes y Docker.
* Sólida comprensión de arquitectura de microservicios, APIs REST y tecnologías de transmisión de datos.
* Habilidades analíticas y atención al detalle, con un fuerte compromiso con la calidad y la optimización del rendimiento.
* Excelentes habilidades de comunicación y capacidad para colaborar eficazmente en equipos multidisciplinarios.