¿Te apasiona la arquitectura de datos, los entornos analíticos modernos y la transformación hacia modelos Lakehouse? ¿Te gustaría tener un rol principal en la definición de la futura plataforma de datos de una gran organización como el Grupo Eroski?
Experiencia, cualificaciones y habilidades interpersonales, ¿tiene todo lo necesario para triunfar en esta oportunidad? Descúbralo a continuación.
En Eroski estamos abordando un proceso estratégico de evolución de nuestro ecosistema de datos y analítica, y buscamos incorporar un/a Arquitecta/o de Datos – Lakehouse & Analytics que lidere la definición de la arquitectura objetivo y acompañe la transición desde los entornos actuales hacia un modelo Lakehouse moderno, escalable y gobernado, que habilite analítica avanzada, machine learning y futuros casos de IA/GenAI.
Cuál será tu misión?
* Definir la arquitectura objetivo de datos y el roadmap de transición desde el ecosistema actual hacia un modelo Lakehouse.
* Diseñar patrones de ingestión, transformación, modelado, consumo y gobierno del dato, asegurando soluciones escalables y alineadas con el negocio.
* Garantizar la convivencia y evolución de entornos legacy y target (Oracle DWH, Denodo, Cloudera y cloud), así como la habilitación de casos de reporting, analítica avanzada, machine learning e IA/GenAI sobre GCP y Vertex AI.
* Establecer estándares de diseño en data products, capas semánticas, calidad, linaje, seguridad y observabilidad del dato.
* Colaborar estrechamente con negocio, analítica, ingeniería y plataformas, participando en decisiones tecnológicas clave, priorización de iniciativas y definición de buenas prácticas de arquitectura e ingeniería de datos, así como otras funciones y responsabilidades propias del rol.
Buscamos personas con formación y experiencia…
* Formación en Ingeniería Informática, Business Analytics, ADE o Gobierno del Dato.
* Experiencia sólida en arquitectura de datos y plataformas analíticas complejas.
* Experiencia con entornos Lakehouse, procesamiento distribuido y arquitecturas híbridas on-premise y cloud. xpzdshu
* Conocimientos en Cloudera, Apache Iceberg, dbt, PySpark, SQL, GCP, Azure, Orac.
#J-18808-Ljbffr