Publicada el 18 junio
Misión del puesto
Experteer Overview En Deloitte, impulsarás la transformación de grandes organizaciones mediante procesamiento distribuido de datos. Coordinarás con equipos de arquitectura y análisis para diseñar soluciones escalables y de alto rendimiento. Serás responsable de optimizar pipelines en Spark y gestionar entornos en AWS para mejorar rendimiento y coste. Contribuirás a la calidad del código, pruebas y documentación, apoyando un enfoque ágil y colaborativo. Esta es una oportunidad para impactar proyectos de alto impacto y crecer en un entorno global.Compensaciones / Beneficios
- Diseñar, desarrollar y optimizar procesos de procesamiento distribuido de datos con Apache Spark
- Implementar y mantener pipelines de datos en AWS Glue y/o Amazon EMR
- Colaborar con arquitectos y analistas de datos para definir soluciones escalables y de alto rendimiento
- Analizar e interpretar los QueryPlan de Spark y usar SparkUI para detectar cuellos de botella y oportunidades de optimización
- Asegurar la calidad del código, las pruebas y la documentación técnica
- Identificar oportunidades de mejora en rendimiento y costes en entornos cloudResponsabilidades
- Experiencia sólida en Apache Spark (PySpark o Scala)
- Conocimiento avanzado de AWS Glue y/o Amazon EMR
- Capacidad para analizar y optimizar ejecuciones en Spark, incluyendo interpretación de QueryPlan y uso de SparkUI
- Experiencia en desarrollo de ETL/ELT en entornos distribuidos
- Manejo de Python y buenas prácticas de programación
- Conocimientos de servicios AWS (S3, DynamoDB, Lambda, IAM, etc.)
- Experiencia trabajando en entornos ágiles y colaborativosRequisitos principales
- horario híbrido–flexible
- equilibrio teletrabajo–oficina
- ambiente de teambuildings
- programa de bienestar (físico, mental y financiero)
- equipo médico en oficinas
- voluntariado nacional e internacional y pro-bono