Contexto del proyecto
Por favor, verifique que tiene el nivel de experiencia y las cualificaciones adecuadas leyendo la descripción completa de esta oportunidad a continuación.
Nuestro cliente en España está desplegando un proyecto de IA / GenAI a gran escala sobre una plataforma cloud
(GCP) apoyada en un stack moderno de datos (DBT, Python, Kubernetes).
Ya contamos con un equipo de Data Engineers y MLOps encargándose de pipelines de datos, infraestructura y
despliegue; ahora necesitamos Machine Learning Engineers (MLE) y Machine Learning Scientists
(MLS) orientados a infraestructura y datos de IA, para asegurar que modelos y datos circulan de forma robusta,
escalable y monitorizada en producción.
Key responsibilities – MLE / MLS
• Diseñar, entrenar y optimizar modelos de machine learning (tabulares, NLP, embeddings, etc.) para escenarios de
IA y GenAI, asegurando reproducibilidad, escalabilidad y alineación con métricas de negocio.
• Trabajar junto con Data Engineers para definir requisitos de datos, feature pipelines y formatos de almacenamiento,
y con MLOps para diseñar cómo se versionan, despliegan y monitorean los modelos en Kubernetes.
• Definir y configurar pipelines de datos y ML (batch/real-time) usando Python, DBT y herramientas de orchestration,
de forma integrada con la infra existente.
• Asegurar trazabilidad de datos y modelos: lineage, versionado, métricas de modelo y datos, y monitorización de
drift (data drift, concept drift) para mantener la calidad en producción.
• Documentar arquitecturas de modelos, decisiones técnicas y dashboards de monitoreo para que el equipo de IA,
MLOps y Data Engineering pueda operar el sistema de forma colaborativa.
Mandatory skills – MLE / MLS
• Experiencia sólida en Python para modelado (scikit-learn, XGBoost, etc.) y, si es posible, deep learning (PyTorch o
TensorFlow).
• Conocimiento práctico de GCP (BigQuery, Cloud Storage, etc.) y experiencia con Kubernetes / Docker o al menos con
entornos containerizados.
• Experiencia en ciclo completo de ML (data prep, feature engineering, entrenamiento, validación, evaluación y puesta
en producción de modelos).
• Familiaridad con herramientas de pipelines de datos (DBT, Airflow o equivalentes) y con herramientas de
tracking de modelos (MLflow, Weights & Biases, Vertex AI, etc.).
• Comprensión de tests estadísticos, métricas de clasificación/regresión y conceptos de drift para monitoreo y
mejora continua.
• Español fluido (residencia en España) y capacidad de trabajar en inglés técnico con equipos internos.
Nice-to-have skills – MLE / MLS
• Experiencia con GenAI / LLMs (fine-tuning, prompt engineering, embeddings, RAG) y librerías como Hugging Face,
LangChain, etc.
• Experiencia previa en roles de MLOps o Data Engineering o haber trabajado en estrecho contacto con equipos de
infraestructura y datos de IA.
• Conocimiento de CI/CD para ML, pipelines de re-entrenamiento automatizados, scoring en batch y streaming, y
monitorización de modelos en producción. xcskxlj
• Background en investigación aplicada / ciencia de datos (MLS más orientado a diseñar experimentos y prototipos
robustos ligados a infraestructura).
• Experiencia en otros ecosistemas (Spark, Cloud Composer, etc.) como plus para integrarse con el stack de datos ya
existente