Estamos buscando un Ingeniero de Datos apasionado por la inteligencia artificial y las tecnologías emergentes para trabajar en la implementación de herramientas basadas en modelos de machine learning e IA generativa.
El candidato ideal deberá ser capaz de integrar datos de múltiples fuentes y naturalezas, seleccionar las bases de datos óptimas para cada caso y diseñar e implementar los prompts adecuados para cada ámbito de aplicación. Se estará actualizado en nuevos frameworks, metodologías, modelos y herramientas en el campo del machine learning, IA generativa y los modelos de lenguaje grande (LLM). También se desarrollarán soluciones para la explotación.
Responsabilidades:
* Integración de APIs de LLM.
* Gestión de datos de diversas fuentes y naturalezas.
* Selección y mantenimiento de bases de datos óptimas para cada caso.
* Diseño e implementación de prompts para chatbots y agentes de IA.
* Desarrollo de soluciones de explotación de datos para Business Intelligence y machine learning.
Competencias Soft:
Capacidad para trabajar en equipo y colaborar eficazmente.
Habilidad para aprender rápidamente nuevas tecnologías.
Fuertes habilidades analíticas y de resolución de problemas.
Herramientas y Tecnologías:
Python, Node.js.
APIs de modelos de lenguaje (GPT, etc.).
Requisitos:
Ingeniería Informática, Ingeniería en Telecomunicaciones, y/o Master en Big Data.
Experiencia en programación con Python y/o Node.js para manipulación de datos e integración de APIs.
Experiencia y conocimientos con bases de datos relacionales y no relacionales.
Experiencia con librerías de manipulación de datos (Pandas, NumPy).
Conocimiento de arquitectura de servicios de backend.
Habilidades Deseadas:
Conocimiento del ecosistema de software Apache enfocado a Big Data (Spark, Kafka, Hadoop, Airflow...).
Familiaridad con LLMs, experiencia usando modelos como GPT/LLaMA a través de API.
Familiaridad con frameworks para aplicaciones basadas en LLMs como Langchain o LlamaIndex.
Entender cómo hacer fine-tuning a modelos pre-entrenados.
Experiencia con bases de datos como MongoDB, Cassandra o PostgreSQL.
Experiencia con bases de datos vectoriales y de grafos, como QDrant/Weavite/Chroma/pgvector y Neo4j.
Experiencia para desarrollar aplicaciones basadas en modelos de embeddings.
Aptitud para mantenerse al día con las últimas tendencias en IA generativa y LLM.
#J-18808-Ljbffr