Data Engineer – Impact & Human-Centered AI
Empresa: Findspo
Equipo: Data Intelligence & AI Infrastructure
Tipo: Full-time
Ubicación: Remoto / Híbrido (España – Manresa)
⸻
Sobre Findspo
En Findspo construimos tecnología para tomar decisiones mejores en contextos donde equivocarse tiene un coste humano.
Trabajamos con gobiernos, organizaciones humanitarias y entidades científicas desarrollando infraestructuras de datos e inteligencia artificial aplicadas a retos estructurales como:
• Cribado y prevención temprana en salud (MAaS para cáncer).
• Longevidad saludable y planificación de cuidados en sociedades envejecidas.
• Tecnología humanitaria y resiliencia territorial.
• Movilidad humana y desplazamientos climáticos.
Nuestra aproximación combina datos reales, datos sintéticos, simulación ética e IA confiable, siempre bajo marcos regulatorios exigentes (GDPR, AI Act) y con una visión clara:
la tecnología debe ampliar capacidades humanas, no sustituirlas ni ponerlas en riesgo.
⸻
El rol
Buscamos un/a Data Engineer para diseñar y operar la infraestructura de datos que hace posible nuestra plataforma de inteligencia territorial, sanitaria y humanitaria.
Este rol es fundamental para transformar datos incompletos, sensibles o dispersos en sistemas robustos, auditables y escalables, capaces de alimentar:
• Modelos de cribado temprano en salud.
• Simulación de escenarios de desplazamiento climático.
• Análisis de longevidad y envejecimiento poblacional.
• Productos SaaS y APIs de datos para sector público y B2G.
No es un rol de mantenimiento.
Es un rol para personas que disfrutan cuando una arquitectura bien pensada evita diez problemas futuros.
Y sí: preferimos una query elegante en BigQuery a veinte parches apresurados.
⸻
Qué harás
• Diseñar y mantener pipelines de datos (ETL / ELT) para salud, clima, demografía y movilidad humana.
• Integrar datos reales, open data y datos sintéticos (SynthGAN) en flujos productivos seguros.
• Preparar datasets para:
• Modelos de IA (ML, GAN, RAG).
• Simulación de escenarios y análisis predictivo.
• Diseñar modelos de datos interoperables para entornos GovTech y espacios de datos.
• Construir y mantener Data as a Service (APIs) para consumo interno y externo.
• Colaborar estrechamente con Data Scientists, ML Engineers y equipos de producto.
• Aplicar principios de gobernanza, trazabilidad, control de acceso y cumplimiento normativo.
⸻
Nuestro stack tecnológico
Lenguajes y procesamiento
• Python (core)
• SQL
• Pandas, Dask, Spark
ETL y orquestación
• Apache Airflow / Prefect
• dbt
Bases de datos
• PostgreSQL / PostGIS
• MongoDB
• Data lakes en cloud
Datos geoespaciales
• PostGIS, GeoPandas
• Integración GIS (QGIS, raster / vector)
IA y datos avanzados
• Preparación de datos para ML, GAN y RAG
• Feature engineering y embeddings
Infraestructura y Cloud
• Google Cloud Platform (stack principal)
• BigQuery
• Cloud Storage
• Cloud Functions / Cloud Run
• IAM y seguridad
• Docker
• Kubernetes
• CI/CD
Buscamos perfiles que entiendan que infraestructura es producto, y que en GCP no todo se resuelve \"subiendo recursos\", sino diseñando bien desde el principio.
⸻
Qué buscamos
Requisitos
• Experiencia como Data Engineer o rol equivalente.
• Dominio sólido de Python y SQL.
• Experiencia real construyendo pipelines de datos en producción.
• Conocimiento de arquitecturas cloud-native.
• Experiencia trabajando con Google Cloud Platform, especialmente BigQuery.
• Capacidad para balancear rendimiento, coste, escalabilidad y mantenibilidad.
Muy valorable
• Experiencia avanzada en arquitectura de datos en GCP.
• Experiencia con datos de salud, clima, demografía o sector público.
• Conocimiento de datos sintéticos, anonimización o privacidad diferencial.
• Haber trabajado en entornos B2G, GovTech o proyectos europeos.
⸻
Modalidad de trabajo
• Teletrabajo como opción.
• Se valorará positivamente la posibilidad de trabajo híbrido en Manresa
La presencialidad no es control, es colaboración con sentido.
⸻
Lo que no buscamos
• Perfiles centrados solo en dashboards.
• Optimización técnica sin comprensión del impacto social.
• IA sin contexto humano.
• Pipelines heredados \"porque siempre se ha hecho así\".
⸻
Nuestra cultura
En Findspo:
• Construimos tecnología para contextos reales, no demos de laboratorio.
• Trabajamos con científicos, administraciones y comunidades.
• Priorizamos impacto a largo plazo sobre modas tecnológicas.
• Diseñamos sistemas que permiten probar políticas y decisiones sin dañar a nadie.
• Valoramos criterio técnico, autonomía y responsabilidad ética.
Aquí no vienes solo a mover datos.
Vienes a construir infraestructuras que sostienen decisiones que afectan vidas.
⸻
Qué ofrecemos
• Proyectos con impacto social real y medible.
• Autonomía técnica y capacidad de decisión.
• Trabajo con IA avanzada, datos sintéticos y simulación.
• Flexibilidad real (remoto / híbrido).
• Participación en proyectos europeos e internacionales.