Ingeniero/a de Machine Learning orientado/a a producción, con fuerte base en Python y Kubernetes, capaz de desplegar y operar modelos de IA en un entorno corporativo IBM, integrándose con equipos de Data Science y Software Engineering, con foco en sistemas de gestión documental inteligente, observabilidad, estabilidad y cumplimiento de SLAs.
Objetivo del rol
Responsable de operacionalizar, desplegar, monitorizar y mantener modelos de IA en un entorno corporativo basado en Kubernetes (IBM Cloud / IKS), garantizando rendimiento, escalabilidad, estabilidad y trazabilidad, actuando como puente técnico entre Data Science, Software Engineering y negocio.
El foco principal es gestión documental inteligente (OCR, clasificación, extracción, procesamiento de documentos) mediante microservicios de IA.
Conocimientos técnicos fundamentales (core skills)
Machine Learning aplicado (orientado a producción)
* Comprensión sólida de:
* Pipelines de inferencia
* Diferencia entre entrenamiento e inferencia
* Modelos de clasificación, extracción, OCR, NLP
* Capacidad para:
* Consumir modelos ya entrenados por Data Scientists
* Entender sus limitaciones, latencias y requisitos de recursos
* Experiencia con:
* Modelos pesados (CPU-bound)
* Inferencias síncronas y asíncronas
* Batch vs real-time inference
No se espera que entrene modelos, pero sí que los entienda lo suficiente para desplegarlos correctamente.
Python avanzado orientado a backend / ML
* Python como lenguaje principal
* Dominio de:
* Programación asíncrona (async/await)
* Concurrencia (threads, event loops, semaphores)
* Gestión de memoria y recursos
* Experiencia integrando:
* Librerías internas de Data Science (SDK corporativo)
* Frameworks de serving (ej. MLServer, FastAPI)
* Capacidad para:
* Detectar cuellos de botella
* Evitar bloqueos de event loop
* Diseñar código "production-safe"
Kubernetes y despliegue en entorno IBM
Kubernetes (nivel medio–alto)
* Uso y configuración de:
* Pods, Deployments, Services
* ConfigMaps y Secrets
* Requests / Limits de CPU y memoria
* Liveness / Readiness probes
* Comprensión de:
* Escalado horizontal (HPA)
* Comportamiento de múltiples workers
* Impacto del paralelismo en modelos IA
* Capacidad para:
* Ajustar recursos según carga real
* Analizar problemas de saturación o colas
Entorno IBM Cloud
* Experiencia o familiaridad con:
* IBM Kubernetes Service (IKS)
* IBM Cloud Object Storage
* IBM Log Analysis / LogDNA
* Entender restricciones de:
* Red corporativa
* Proxies (Istio, ingress)
* Seguridad y compliance
Arquitectura de microservicios de IA
* Diseño y operación de:
* Microservicios de inferencia
* APIs REST (FastAPI)
* Integración con:
* Servicios de backend del equipo de Software Engineering
* Sistemas de almacenamiento documental
* Gestión de:
* Versionado de modelos
* Versionado de APIs
* Compatibilidad hacia atrás
* Capacidad para:
* Diagnosticar errores en producción
* Analizar trazas entre servicios
Observabilidad, monitorización y operación
Monitorización de recursos
* Uso de Grafana para:
* CPU / memoria
* Latencias
* Throughput
* Saturación de workers
* Capacidad para:
* Interpretar métricas
* Ajustar configuración en base a datos reales
Logging y debugging
* Uso de IBM Log Analysis para:
* Analizar errores en microservicios
* Correlacionar eventos
* Detectar patrones anómalos
* Buenas prácticas de:
* Logging estructurado
* Niveles de log (INFO / WARNING / ERROR)
* Logs seguros (sin datos sensibles)
Gestión documental inteligente (domain knowledge)
* Comprensión funcional de:
* OCR
* Clasificación de documentos
* Extracción de información
* Conversión de formatos (PDF, Office, imágenes)
* Capacidad para:
* Traducir necesidades de negocio a flujos técnicos
* Ajustar pipelines según tipo documental
* Sensibilidad a:
* Calidad del dato
* Casos borde (documentos corruptos, escaneados, grandes volúmenes)
Colaboración inter-equipos
Con Data Science
* Capacidad para:
* Integrar modelos sin modificar su lógica
* Proponer cambios orientados a producción (no a investigación)
* Comunicación fluida sobre:
* Latencias
* Consumo de recursos
* Limitaciones técnicas
Con Software Engineering
* Entender:
* Contratos de API
* Requisitos de integración
* SLAs
* Hablar el mismo "lenguaje técnico" que backend engineers
Traducción de negocio a técnico
* Capacidad para:
* Entender requisitos funcionales explicados por Project Managers
* Convertirlos en:
* Requisitos técnicos
* Configuración de servicios
* Métricas observables
* Mentalidad de:
* Prioridad
* Impacto
* Coste vs beneficio técnico
Entorno local y herramientas de desarrollo (Windows)
* Trabajo habitual en Windows:
* Python
* Docker
* IDEs (VS Code, PyCharm)
* Capacidad para:
* Replicar localmente el stack de Kubernetes (parcial)
* Depurar problemas antes de subir a cloud
* Uso de:
* Git
* Entornos virtuales
* Testing básico (unitario / integración)
Soft skills clave (muy importantes en este rol)
* Mentalidad operacional (production-first)
* Capacidad de análisis bajo presión
* Comunicación clara con perfiles técnicos y no técnicos
* Autonomía y responsabilidad
* Orientación a estabilidad y fiabilidad (no solo "que funcione")
OFRECEMOS:
* · Contrato en modalidad Freelance Full time
* · Oferta económica: 240€ / 320€ jornada + IVA (según experiencia aportada)
* · Proyecto de Larga Duración. Recurrencia en Proyectos
* · Localización: España – Teletrabajo 100%