Desde Hays buscamos incorporar un/a Data Engineer con experiencia sólida en entornos Big Data, Scala/Java y Spark, para participar en iniciativas estratégicas de datos e inteligencia artificial a gran escala.
Si quieres formar parte de un entorno moderno, cloud y altamente técnico, esta es tu ocasión.
¿Qué harás?
Diseñarás y desarrollarás pipelines de datos escalables, robustos y eficientes en entornos Big Data.
Liderarás procesos ETL/ELT en plataformas distribuidas, especialmente sobre Databricks y Apache Spark.
Desarrollarás soluciones de ingeniería en Scala y/o Java, asegurando calidad y rendimiento.
Optimizarás modelos de datos y consultas en motores distribuidos como Trino o Starburst.
Trabajarás sobre arquitecturas Data Lake / Lakehouse con almacenamiento tipo S3.
Orquestarás workflows complejos con Airflow y/o Control‑M.
Colaborarás con equipos de Data Science, ML e IA para industrializar modelos y procesos.
Contribuirás a decisiones de arquitectura, estándares y mejores prácticas de ingeniería de datos.
Asegurarás la gobernanza, trazabilidad y calidad del dato en todo el ciclo de vida.
Requisitos
~+3 años de experiencia como Data Engineer en entornos Big Data.
~ Experiencia avanzada en Scala y/o Java.
~ Dominio de Apache Spark, incluyendo optimización y tuning.
~ Experiencia trabajando con Databricks.
~ Conocimiento sólido de SQL y motores distribuidos (Trino/Starburst, etc.).
~ Experiencia con S3 o almacenamiento equivalente en cloud.
~ Experiencia con Airflow y/o Control‑M.
~ Conocimiento de Data Lake, Lakehouse, Delta Lake.
~ Experiencia en Azure y/o AWS.
~ Buenas prácticas: testing, CI/CD (Git Actions / UrbanCode), Git.
~ Experiencia en metodologías Agile con Jira.
~ Inglés fluido (se realiza prueba).
Se valorará
Conocimientos de Streaming (Kafka, Spark Structured Streaming).
Experiencia con Python.
Conocimiento en data lineag