Data scientist / machine learning engineer – llms / rag / python – remoto desde españa

Huelva

TheWhiteam

Publicada el 22 abril

Descripción

* Chunking
* Embeddings
* SQL
* Pandas, NumPy, scikit-learn, Pydantic
* PySpark (deseable)
* Embedding engineering
* LangChain / LangGraph
* Testing
Descripción del puesto

En The Whiteam Consulting estamos buscando Data Scientists y Machine Learning Engineers para integrarse en equipos altamente especializados en Inteligencia Artificial Generativa, desarrollando PoCs, agentes de IA y soluciones avanzadas basadas en LLMs.

El rol combina ciencia de datos, ingeniería de machine learning, desarrollo Python, arquitectura RAG, MLOps/LLMOps y experimentación continua con modelos generativos. Participarás en el ciclo completo de soluciones LLM: ingestión de datos, embeddings, retrieval, evaluación, puesta en producción y optimización.

Responsabilidades
* Diseñar, implementar y desplegar aplicaciones basadas en LLMs, desde la concepción hasta la monitorización en producción.
* Construir pipelines RAG:
o Ingestión
o Chunking
o Embeddings
o Retrieval híbrido
o Re‑ranking
o QA y métricas
* Desarrollar técnicas avanzadas de prompt engineering, integración de herramientas, workflows, agentes y multi‑agentes.
* Implementar soluciones con Python, Pandas, NumPy, scikit-learn y librerías de NLP/LLMs.
* Utilizar frameworks como LangChain, LangGraph, FAISS, OpenSearch o vectordDBs similares.
* Diseñar pruebas y evaluaciones para LLMs: calificación, evaluación métrica, análisis de rendimiento.
* Gestionar riesgos asociados a IA generativa: sesgos, alucinaciones, RAI, privacidad y gobernanza.
* Optimizar rendimiento y coste de los modelos en producción, aplicando A/B testing.
* Coordinar con producto, ingeniería y diseño para alinear requerimientos y entregables.
* Contribuir a pipelines MLOps/LLMOps: CI/CD, testing, observabilidad, APIs, despliegues.
Requisitos
* Fundamentos sólidos en:
o Estadística
o Machine Learning
o SQL
* Programación experta en Python y librerías principales:
o Pandas, NumPy, scikit-learn, Pydantic
o PySpark (deseable)
* Conocimiento en LLMs:
o Prompt engineering
o Embedding engineering
o Optimización y evaluación de LLMs
* Experiencia con:
o LangChain / LangGraph
o FAISS, OpenSearch u otras VectorDBs
* Experiencia en MLOps / LLMOps:
o Testing
o Observabilidad
o Diseño de APIs REST
o Servir aplicaciones (FastAPI, Flask)
o Integración con OpenAI u otros servicios
* Experiencia real con datos financieros, business analytics o entornos regulados (muy valorable).
* Experiencia trabajando en Agile, uso de Jira, Git y CI/CD (Jenkins u otros).
* Excelentes habilidades de comunicación con stakeholders.
Deseables
* Frameworks:
o PyTorch, TensorFlow, Hugging Face Transformers
* Cloud & DevOps:
o AWS SageMaker, Athena, Lambda, Step Functions
o API Gateway, Docker, Kubernetes / EKS
* Experiencia en arquitecturas multi‑agente y herramientas avanzadas de IA.
* Experiencia en migraciones de modelos a producción y optimización de entorno nube.
Modalidad
* Trabajo híbrido/remoto (según proyecto).
* Disponibilidad para reuniones presenciales puntuales.
Beneficios
* Nuestro convenio es el de Consultoras y estudios de mercado
* Tenemos 23 días de vacaciones al año
* Tenemos 14 pagas, 12 mensuales y dos extras (junio y diciembre)
* Como retribución flexible podemos pedir ticket guardería y también seguro médico + dental.
#J-18808-Ljbffr

Enviar

Crear una alerta

Guardar