Estamos ampliando nuestra
Factoría de IA
y buscamos un/a
Data Scientist
con experiencia en Google Cloud para desarrollar modelos con impacto real en negocio, trabajando con una arquitectura moderna basada en
BigQuery, Dataflow, Pub/Sub y Vertex AI. Colaborarás con ML Engineering para llevar modelos a producción y exponerlos como servicios.
Tu misión Convertir problemas de negocio en modelos medibles y útiles. Asegurar
reproducibilidad, trazabilidad y calidad
desde los datos hasta los resultados. Colaborar para que los modelos lleguen a producción con garantías.
Tecnología con la que trabajarás Datos:
BigQuery (modelado, optimización y control de costes), Dataflow/Pub/Sub para pipelines y
Feature Store
para features consistentes. Modelos:
Vertex AI (Workbench, Experiments, Pipelines, Model Registry, Endpoints/Batch) para entrenar, registrar y servir modelos. Exposición:
Integración con
Cloud Run + API Gateway
junto al equipo de ML Engineering. Observabilidad y negocio:
Métricas y cuadros de mando en
Looker. Gobierno:
CI/CD, IaC y prácticas alineadas a
GDPR/EU AI Act .
Lo que harás Analizar datos en BigQuery, definir KPIs y criterios de éxito. Diseñar datasets y features reutilizables con Feature Store. Entrenar y comparar modelos en Vertex AI; ajustar hiperparámetros y validar resultados. Evaluar calidad técnica (ej. ROC-AUC, F1, RMSE) y valor de negocio (€). Explicar modelos con técnicas interpretables (SHAP, ICE, PDP). Colaborar en umbrales, AB testing y pilotos con negocio. Empaquetar entrenamientos en Pipelines y registrar artefactos en Model Registry. Definir métricas operativas y políticas de reentrenamiento. Documentar con
model cards, fichas de datasets y notebooks claros.
Requisitos imprescindibles 5–8+ años
en Data Science con modelos reales en producción. Fuerte base en estadística y machine learning. Dominio de
Python
(pandas, scikit-learn; TF/PyTorch valorables) y
SQL avanzado. Experiencia en
BigQuery
y optimización de costes. Trabajo real con
Vertex AI
(Workbench, Experiments, Pipelines, Model Registry). Conocimiento de
Feature Store
y ciclos train/serve. Colaboración con ML Engineering para despliegues en Endpoints/Batch y definición de SLOs. Buenas prácticas de datos, gobierno y cumplimiento ( GDPR / EU AI Act ). Conocimiento de Git y habilidades de comunicación orientadas a producto.
Te esperamos!