Ingeniero/a de Machine Learning orientado/a a producción, con robusto base en Python y Kubernetes, capaz de desplegar y operar modelos de IA en un entorno corporativo IBM, integrándose con equipos de Data Science y Software Engineering, con foco en sistemas de gestión documental inteligente, observabilidad, estabilidad y cumplimiento de SLAs.
\n
Objetivo del rol
\n
Responsable de operacionalizar, desplegar, monitorizar y mantener modelos de IA en un entorno corporativo basado en Kubernetes (IBM Cloud / IKS), garantizando rendimiento, escalabilidad, estabilidad y trazabilidad, actuando como puente técnico entre Data Science, Software Engineering y negocio.
\n
El foco principal es gestión documental inteligente (OCR, clasificación, extracción, procesamiento de documentos) mediante microservicios de IA.
\n
Conocimientos técnicos fundamentales (core skills)
\n
Machine Learning aplicado (orientado a producción)
\n
- Comprensión sólida de:
- Pipelines de inferencia
- Diferencia entre entrenamiento e inferencia
- Modelos de clasificación, extracción, OCR, NLP
- Capacidad para:
- Consumir modelos ya entrenados por Data Scientists
- Entender sus limitaciones, latencias y requisitos de recursos
- Experiencia con:
- Modelos pesados (CPU-bound)
- Inferencias síncronas y asíncronas
- Batch vs real-time inference
No se espera que entrene modelos, pero sí que los entienda lo suficiente para desplegarlos correctamente .\n
Python avanzado orientado a backend / ML
\n
- Python como lenguaje principal
- Dominio de:
- Programación asíncrona (async/await)
- Concurrencia (threads, event loops, semaphores)
- Gestión de memoria y recursos
- Experiencia integrando:
- Librerías internas de Data Science (SDK corporativo)
- Frameworks de serving (ej. MLServer, FastAPI)
- Capacidad para:
- Detectar cuellos de botella
- Evitar bloqueos de event loop
- Diseñar código \"production-safe\"
Kubernetes y despliegue en entorno IBM\n
Kubernetes (nivel medio–alto)
\n
- Uso y configuración de:
- Pods, Deployments, Services
- ConfigMaps y Secrets
- Requests / Limits de CPU y memoria
- Liveness / Readiness probes
- Comprensión de:
- Escalado horizontal (HPA)
- Comportamiento de múltiples workers
- Impacto del paralelismo en modelos IA
- Capacidad para:
- Ajustar recursos según carga real
- Analizar problemas de saturación o colas
Entorno IBM Cloud\n
- Experiencia o familiaridad con:
- IBM Kubernetes Service (IKS)
- IBM Cloud Object Storage
- IBM Log Analysis / LogDNA
- Entender restricciones de:
- Red corporativa
- Proxies (Istio, ingress)
- Seguridad y compliance
Arquitectura de microservicios de IA\n
- Diseño y operación de:
- Microservicios de inferencia
- APIs REST (FastAPI)
- Integración con:
- Servicios de backend del equipo de Software Engineering
- Sistemas de almacenamiento documental
- Gestión de:
- Versionado de modelos
- Versionado de APIs
- Compatibilidad hacia atrás
- Capacidad para:
- Diagnosticar errores en producción
- Analizar trazas entre servicios
Observabilidad, monitorización y operación\n
Monitorización de recursos
\n
- Uso de Grafana para:
- CPU / memoria
- Latencias
- Throughput
- Saturación de workers
- Capacidad para:
- Interpretar métricas
- Ajustar configuración en base a datos reales
Logging y debugging\n
- Uso de IBM Log Analysis para:
- Analizar errores en microservicios
- Correlacionar eventos
- Detectar patrones anómalos
- Buenas prácticas de:
- Logging estructurado
- Niveles de log (INFO / WARNING / ERROR)
- Logs seguros (sin datos sensibles)
Gestión documental inteligente (domain knowledge)\n
- Comprensión funcional de:
- OCR
- Clasificación de documentos
- Extracción de información
- Conversión de formatos (PDF, Office, imágenes)
- Capacidad para:
- Traducir necesidades de negocio a flujos técnicos
- Ajustar pipelines según tipo documental
- Sensibilidad a:
- Calidad del dato
- Casos borde (documentos corruptos, escaneados, grandes volúmenes)
Colaboración inter-equipos\n
Con Data Science
\n
- Capacidad para:
- Integrar modelos sin modificar su lógica
- Proponer cambios orientados a producción (no a investigación)
- Comunicación fluida sobre:
- Latencias
- Consumo de recursos
- Limitaciones técnicas
Con Software