Data Scientist (AI & Models)Modalidad híbrida en MadridNivel de inglés: avanzadoExperiencia: mínimo 2 añosBuscamos un Científico de Datos para unirse al equipo Corporate & Investment en Madrid. Contribuirá al desarrollo, validación e industrialización de modelos de aprendizaje automático e IA aplicados a problemas de negocio de alto impacto.Colaborarás con científicos de datos, ingenieros y partes interesadas del negocio para ofrecer soluciones robustas, explicables y escalables, abarcando todo el ciclo de vida, desde la definición del problema hasta la implementación y el monitoreo.Responsabilidades: - Desarrollar y aplicar modelos estadísticos, de aprendizaje automático e IA de vanguardia (supervisados/no supervisados, pronósticos, PLN, detección de anomalías, etc.) para casos de uso del entorno bancario. - Realizar exploración de datos, ingeniería de características y evaluación de modelos mediante enfoques cuantitativos rigurosos. - Aplicar las mejores prácticas en validación de modelos: validación cruzada, diagnóstico de sesgo/varianza, calibración, pruebas de robustez y análisis de sensibilidad. - Implementar y mantener pipelines de aprendizaje automático reproducibles (entrenamiento, inferencia, monitoreo) con altos estándares de ingeniería de software. - Contribuir a la explicabilidad y la gobernanza (p. ej., SHAP, atribución de características, estabilidad, documentación), en consonancia con un entorno regulado. - Presentar los resultados con claridad tanto a audiencias técnicas como no técnicas;
traducir los objetivos de negocio en objetivos de modelado medibles. - Mantenerse al día con la IA moderna: aprendizaje profundo, modelos de aprendizaje automático (MLA), aprendizaje de representaciones y herramientas emergentes;
prototipar cuando sea pertinente.Requisitos indispensables: - Licenciatura o maestría en Ciencias de la Computación, Matemáticas, Estadística, Física, Ingeniería o un campo cuantitativo relacionado. - Sólidos conocimientos de álgebra lineal, probabilidad, estadística, optimización y métodos numéricos. - Sólidas habilidades de programación en Python (código limpio, enfoque en pruebas, fundamentos de empaquetado). - Experiencia práctica con bibliotecas de aprendizaje automático como scikit-learn y familiaridad con al menos un framework de aprendizaje profundo (PyTorch o TensorFlow). - Conocimientos prácticos de evaluación de modelos y métricas (AUC, precisión/exhaustividad, RMSE, calibración, etc.) y metodología de experimentación. - Experiencia trabajando con datos usando pandas/numpy y realizando consultas SQL. - Buenas habilidades de comunicación y capacidad para trabajar en equipos colaborativos y multidisciplinarios. - Dominio avanzado de inglés.Se valorará positivamente: - Experiencia previa en puestos similares. - Conocimientos de PLN (transformadores, incrustaciones), modelos lógicos del lenguaje (PLL) o conceptos de IA generativa (indicación, ajustes básicos, recuperación). - Comprensión de los conceptos y herramientas de MLOps (p. ej., MLflow, Docker, CI/CD, monitorización de modelos). - Experiencia con plataformas en la nube (AWS/Azure/GCP) y procesamiento distribuido (p. ej., Spark). - Familiaridad con Databricks (o disposición para aprenderlo en el trabajo) para el desarrollo colaborativo y flujos de trabajo de aprendizaje automático escalables. - Familiaridad con el modelado de series temporales, pruebas de estrés o inferencia causal. - Interés o experiencia con productos y procesos de banca corporativa y de inversión / banca global (p. ej., préstamos, comercio y capital de trabajo, DCM/ECM, banca transaccional) y cómo los datos/la IA pueden respaldarlos (análisis de clientes, precios, límites, alerta temprana). - Se valorará el conocimiento del riesgo de modelos/gobernanza en industrias reguladas (documentación, trazabilidad, controles). - Familiaridad con conceptos de análisis financiero como los impulsores de pérdidas y ganancias, métricas del balance, FTP, capital/RWA o informes de gestión;
capacidad para traducirlos KPI financieros en objetivos de modelado. - Comprensión de los fundamentos del riesgo (riesgo de crédito, riesgo de mercado, riesgo de liquidez, riesgo operativo) y temas comunes de modelado como PD/LGD/EAD, calificaciones/cuadros de puntuación, pruebas de estrés, señales de alerta temprana o monitoreo de cartera en un entorno regulado.