Ingeniero/a de Machine Learning orientado/a a producción, con fuerte base en Python y Kubernetes, capaz de desplegar y operar modelos de IA en un entorno corporativo IBM, integrándose con equipos de Data Science y Software Engineering, con foco en sistemas de gestión documental inteligente, observabilidad, estabilidad y cumplimiento de SLAs.
Objetivo del rol
Responsable de operacionalizar, desplegar, monitorizar y mantener modelos de IA en un entorno corporativo basado en Kubernetes (IBM Cloud / IKS), garantizando rendimiento, escalabilidad, estabilidad y trazabilidad, actuando como puente técnico entre Data Science, Software Engineering y negocio.
El foco principal es gestión documental inteligente (OCR, clasificación, extracción, procesamiento de documentos) mediante microservicios de IA.
Conocimientos técnicos fundamentales (core skills)
Machine Learning aplicado (orientado a producción)
Comprensión sólida de:
Pipelines de inferencia
Diferencia entre entrenamiento e inferencia
Modelos de clasificación, extracción, OCR, NLP
Capacidad para:
Consumir modelos ya entrenados por Data Scientists
Entender sus limitaciones, latencias y requisitos de recursos
Experiencia con:
Modelos pesados (CPU-bound)
Inferencias síncronas y asíncronas
Batch vs real-time inference
No se espera que entrene modelos, pero sí que los entienda lo suficiente para desplegarlos correctamente .
Python avanzado orientado a backend / ML
Python como lenguaje principal
Dominio de:
Programación asíncrona (async/await)
Concurrencia (threads, event loops, semaphores)
Gestión de memoria y recursos
Experiencia integrando:
Librerías internas de Data Science (SDK corporativo)
Frameworks de serving (ej. MLServer, FastAPI)
Capacidad para:
Detectar cuellos de botella
Evitar bloqueos de event loop
Diseñar código “production-safe”
Kubernetes y despliegue en entorno IBM
Kubernetes (nivel medio–alto)
Uso y configuración de:
Pods, Deployments, Services
ConfigMaps y Secrets
Requests / Limits de CPU y memoria
Liveness / Readiness probes
Comprensión de:
Escalado horizontal (HPA)
Comportamiento de múltiples workers
Impacto del paralelismo en modelos IA
Capacidad para:
Ajustar recursos según carga real
Analizar problemas de saturación o colas
Entorno IBM Cloud
Experiencia o familiaridad con:
IBM Kubernetes Service (IKS)
IBM Cloud Object Storage
IBM Log Analysis / LogDNA
Entender restricciones de:
Red corporativa
Proxies (Istio, ingress)
Seguridad y compliance
Arquitectura de microservicios de IA
Diseño y operación de:
Microservicios de inferencia
APIs REST (FastAPI)
Integración con:
Servicios de backend del equipo de Software Engineering
Sistemas de almacenamiento documental
Gestión de:
Versionado de modelos
Versionado de APIs
Compatibilidad hacia atrás
Capacidad para:
Diagnosticar errores en producción
Analizar trazas entre servicios
Observabilidad, monitorización y operación
Monitorización de recursos
Uso de Grafana para:
CPU / memoria
Latencias
Throughput
Saturación de workers
Capacidad para:
Interpretar métricas
Ajustar configuración en base a datos reales
Logging y debugging
Uso de IBM Log Analysis para:
Analizar errores en microservicios
Correlacionar eventos
Detectar patrones anómalos
Buenas prácticas de:
Logging estructurado
Niveles de log (INFO / WARNING / ERROR)
Logs seguros (sin datos sensibles)
Gestión documental inteligente (domain knowledge)
Comprensión funcional de:
OCR
Clasificación de documentos
Extracción de información
Conversión de formatos (PDF, Office, imágenes)
Capacidad para:
Traducir necesidades de negocio a flujos técnicos
Ajustar pipelines según tipo documental
Sensibilidad a:
Calidad del dato
Casos borde (documentos corruptos, escaneados, grandes volúmenes)
Colaboración inter-equipos
Con Data Science
Capacidad para:
Integrar modelos sin modificar su lógica
Proponer cambios orientados a producción (no a investigación)
Comunicación fluida sobre:
Latencias
Consumo de recursos
Limitaciones técnicas
Con Software Engineering
Entender:
Contratos de API
Requisitos de integración
SLAs
Hablar el mismo “lenguaje técnico” que backend engineers
Traducción de negocio a técnico
Capacidad para:
Entender requisitos funcionales explicados por Project Managers
Convertirlos en:
Requisitos técnicos
Configuración de servicios
Métricas observables
Mentalidad de:
Prioridad
Impacto
Coste vs beneficio técnico
Entorno local y herramientas de desarrollo (Windows)
Trabajo habitual en Windows :
Python
Docker
IDEs (VS Code, PyCharm)
Capacidad para:
Replicar localmente el stack de Kubernetes (parcial)
Depurar problemas antes de subir a cloud
Uso de:
Git
Entornos virtuales
Testing básico (unitario / integración)
Soft skills clave (muy importantes en este rol)
Mentalidad operacional (production-first)
Capacidad de análisis bajo presión
Comunicación clara con perfiles técnicos y no técnicos
Autonomía y responsabilidad
Orientación a estabilidad y fiabilidad (no solo “que funcione”)
OFRECEMOS:
· Contrato en modalidad Freelance Full time
· Oferta económica: 240€ / 320€ jornada + IVA (según experiencia aportada)
· Proyecto de Larga Duración. Recurrencia en Proyectos
· Localización: España – Teletrabajo 100%