Data engineer (la línea de la concepción)

La Línea de la Concepción

Virtual Desk

Publicada el 15 mayo

Descripción

En Virtual Desk impulsamos la transformación digital de grandes organizaciones mediante soluciones innovadoras basadas en inteligencia artificial y automatización de procesos. Combinamos tecnología, estrategia y ejecución para generar impacto real en negocio. Somos un equipo dinámico, colaborativo y orientado a resultados, donde el aprendizaje continuo, la innovación y la excelencia forman parte de nuestro ADN. ️ Responsabilidades Buscamos un/a Data Engineer con sólida formación técnica y pasión por los datos para incorporarse a proyectos innovadores de alto impacto en diversos sectores.

Serás pieza clave en la construcción y evolución de plataformas de datos modernas, trabajando junto a Data Scientists, analistas y BI Engineers en un entorno altamente participativo y tecnológico. Diseñar e implementar arquitecturas de datos (Data Lakes, Data Warehouses y entornos Lakehouse) sobre plataformas cloud y on-premise, garantizando calidad, rendimiento y seguridad. Aplicar metodologías Data Ops para el control de versionado, automatización y gobernanza de los pipelines de datos.

Diseñar, implementar y mantener pipelines ETL/ELT desde el origen hasta los modelos e informes finales, incluyendo orquestación, automatización y procesamiento en near real-time. Monitorizar y documentar el linaje del dato (Data Lineage) a lo largo de todo el ciclo de vida. Trabajar con usuarios de negocio para asegurar el cumplimiento de requisitos, aplicar la calidad del dato adecuada y garantizar el cumplimiento de LOPD/RGPD.

Colaborar en proyectos de Gobierno del Dato, definiendo políticas, estándares y procesos de calidad. Coordinar con científicos y analistas de datos la correcta integración de modelos, análisis e informes en la plataforma de datos. Trabajar de forma transversal con equipos de BI, Data Science y negocio para garantizar la alineación técnica y funcional.

Requisitos Técnicos Titulación universitaria en alguna de las ramas STEM.

Experiencia en entornos cloud (Azure, AWS o GCP) y servicios de datos asociados: Data Factory, Glue, Redshift, Big Query, Snowflake... Dominio de SQL avanzado y experiencia en bases de datos relacionales (SQL Server, Oracle, Postgre SQL) y No SQL.

Experiencia en implementación de pipelines ETL/ELT y soluciones de Data Warehousing y Data Marts.

Conocimiento del ecosistema Big Data y Lakehouse: Hadoop, Spark, Databricks, Apache Iceberg o Delta Lake.

Experiencia en orquestación de workflows (Apache Airflow o similares) y procesamiento en streaming (Kafka, Flink, Kinesis u otros). Programación en Python como lenguaje principal; valorable Scala y/o Java. Conocimientos de Gobierno del Dato, calidad del dato y privacidad (LOPD/RGPD).

Valorable

Experiencia en procesamiento en straming y near real-time (Kafka, Flink, Kinesis) y familiaridad con arquitecturas orientadas a eventos tipo Lambda o Kappa. Conocimientos de Data Lineage, Gobierno del Dato y marcos de calidad aplicados a proyectos reales. Certificaciones cloud (Azure, AQS, GCP) o en tecnologías del ecosistema data.

Nivel de inglés medio-alto para trabajar con documentación técnica y entornos internacionales. ¿Qué Ofrecemos? Colaboración con expertos tech y negocio Proyectos de primer nivel en diversos sectores Póliza de seguros y plan de retribución flexible Entorno de innovación constante y proyección real

Enviar

Crear una alerta

Guardar