Estamos ampliando nuestra Factoría de IA y buscamos un/a Data Scientist con experiencia en Google Cloud para desarrollar modelos con impacto real en negocio, trabajando con una arquitectura moderna basada en BigQuery, Dataflow, Pub/Sub y Vertex AI. Colaborarás con ML Engineering para llevar modelos a producción y exponerlos como servicios.
Tu misión
Convertir problemas de negocio en modelos medibles y útiles.
Asegurar reproducibilidad, trazabilidad y calidad desde los datos hasta los resultados.
Colaborar para que los modelos lleguen a producción con garantías.
Tecnología con la que trabajarás
Datos: BigQuery (modelado, optimización y control de costes), Dataflow/Pub/Sub para pipelines y Feature Store para features consistentes.
Modelos: Vertex AI (Workbench, Experiments, Pipelines, Model Registry, Endpoints/Batch) para entrenar, registrar y servir modelos.
Exposición: Integración con Cloud Run + API Gateway junto al equipo de ML Engineering.
Observabilidad y negocio: Métricas y cuadros de mando en Looker .
Gobierno: CI/CD, IaC y prácticas alineadas a GDPR/EU AI Act .
Lo que harás
Analizar datos en BigQuery, definir KPIs y criterios de éxito.
Diseñar datasets y features reutilizables con Feature Store.
Entrenar y comparar modelos en Vertex AI; ajustar hiperparámetros y validar resultados.
Evaluar calidad técnica (ej. ROC-AUC, F1, RMSE) y valor de negocio (€).
Explicar modelos con técnicas interpretables (SHAP, ICE, PDP).
Colaborar en umbrales, AB testing y pilotos con negocio.
Empaquetar entrenamientos en Pipelines y registrar artefactos en Model Registry.
Definir métricas operativas y políticas de reentrenamiento.
Documentar con model cards, fichas de datasets y notebooks claros.
Requisitos imprescindibles
5–8+ años en Data Science con modelos reales en producción.
Fuerte base en estadística y machine learning.
Dominio de Python (pandas, scikit-learn; TF/PyTorch valorables) y SQL avanzado .
Experiencia en BigQuery y optimización de costes.
Trabajo real con Vertex AI (Workbench, Experiments, Pipelines, Model Registry).
Conocimiento de Feature Store y ciclos train/serve.
Colaboración con ML Engineering para despliegues en Endpoints/Batch y definición de SLOs.
Buenas prácticas de datos, gobierno y cumplimiento ( GDPR / EU AI Act ).
Conocimiento de Git y habilidades de comunicación orientadas a producto.
Te esperamos!