Este perfil describe a un Científico de Datos senior con habilidades técnicas avanzadas en aprendizaje automático (ML), estadística multivariada, NLP (Procesamiento de Lenguaje Natural) y capacidad para comunicar insights a stakeholders. Además, incluye un fuerte componente de ética de datos y experiencia en entornos cloud (AWS).
Habilidades Clave
1. Estadística y Experimentación
* Pruebas de hipótesis y diseño de experimentos A/B.
* Análisis multivariado para identificar relaciones complejas en datos.
2. Machine Learning (ML)
* Desarrollo de modelos predictivos y prescriptivos.
* Optimización y validación de modelos (métricas, cross-validation).
* Modelado avanzado: Sistemas de recomendación, forecasting, optimización.
3. Visualización y Comunicación
* Creación de dashboards en Tableau/Power BI o con librerías de Python/R.
* Storytelling con datos para audiencias no técnicas.
4. Infraestructura y Herramientas
* Cloud (AWS), pipelines ETL y librerías como Pandas, PyTorch, Modin.
* Uso de Spark para big data y SQL para consultas complejas.
5. Gobernanza y Ética
* Cumplimiento de regulaciones (GDPR, HIPAA).
* Buenas prácticas en calidad e integridad de datos.
6. NLP (Valor Añadido)
* Frameworks: Hugging Face, spaCy.
* Modelos de lenguaje: BERT, GPT, RoBERTa.
* Ingeniería de prompts y fine-tuning de LLMs (como ChatGPT).
* Despliegue en producción (AWS SageMaker, Azure ML).
* Experiencia en chatbots/IA conversacional.
Requisitos Principales
* Formación: Grado/Máster en Ciencia de Datos, Estadística o campos técnicos.
* Experiencia: 4-5 años en roles similares.
* Programación: Python avanzado (Pandas, Scikit-learn, PyTorch).
* Soft Skills: Comunicación clara, resolución de problemas y adaptabilidad.
Entorno de Trabajo
* Presencial híbrido (2-3 días/semana en Barcelona).
#J-18808-Ljbffr