Ingeniero de datos Senior
Implementación de pipelines para la ingesta, procesamiento, enriquecimiento y agregación de datos en entornos de Data Lake o Data Warehouse.
Aplicación de controles de calidad de datos en todos los canales.
Monitoreo del rendimiento y costos de la plataforma de la nube.
Estandarización y automatización de procesos de gestión de datos.
Detalle de la actividad:
Ingestión de flujos de datos de sistemas empresariales y terceros.
Creación de canales de enriquecimiento y agregación de datos.
Mantenimiento y evolución de la arquitectura de datos.
Producción de pipelines para modelos ML.
Aplicación de técnicas de calidad de datos.
Uso eficiente de plataformas en la nube (GCP, AWS o Azure).
Seguimiento del uso de recursos y costos.
Mantenimiento y evolución de código.
Definición de procesos de desarrollo estandarizados.
Experiencia con herramientas de control de versiones (Git).
Conocimientos profundos en Python, SQL y pyspark.
Conocimientos en al menos una plataforma de nube (GCP, AWS o Azure).
Familiaridad con frameworks de Big Data (Apache Spark, Hadoop, Hive, Airflow).
Ingles
Remoto100%
#J-18808-Ljbffr