Buscamos incorporar a un/a Arquitecto/a Cloud & MLOps de IA, para unirse a nuestro equipo interno de IA y data!
Tu principal reto: Diseñar y gobernar la plataforma de datos/IA y el ciclo de vida de modelos (end to end), desde ingesta y features hasta serving y observabilidad / para acelerar el paso de POC a producción con seguridad, cumplimiento y coste óptimo en entornos cloud, on prem y edge.
Responsabilidades del rol:
* Arquitectura de referencia: definir landing zones de datos/IA (redes, IAM, cifrado, backups, DRP) y patrones multi‑entorno (cloud/híbrido/on prem/air gapped).
* Data & Feature Platform: data lakehouse/warehouse (Delta/Snowflake/BigQuery), feature store, data contracts y gobierno de datos (calidad, linaje, catálogo).
* Ciclo ML/LLM: experiment tracking, model registry, model cards, approval gates, CI/CD de datos y modelos (GitOps), blue/green/canary y rollbacks.
* Serving: real time/batch/stream (Kafka/Flink), edge/gateway (inferencias <
50ms donde aplique), inference servers (NVIDIA Triton/TorchServe) y autoscaling (K8s).
* LLM & RAG: arquitecturas RAG seguras (vectores, metadata filtering, prompt y output guardrails), evaluation harness (groundedness, factualidad, toxicidad) y observability específica para LLM.
* MLOps: observabilidad de modelos (drift de datos/etiquetas, concept drift, data quality, performance SLO/SLI), alerting y runbooks (SRE/Soporte).
* Seguridad & Compliance: cifrado en tránsito/reposo, secreto/rotación (Vault/KMS), least privilege, network segmentation, audit logs, AI Act ready (riesgo, documentación, supervisión humana) e ISO 27001/42001.
* Coste/FinOps: rightsizing, auto shutdown, spot/reserved, chargeback/showback y budgets por entorno/proyecto.
* Edge & OT: empaquetado y OTA de modelos a gateways/Jetson, sincronización cloud↔edge, telemetría, y seguridad en entornos industriales.
* Tooling & estándares: selección y roadmap de herramientas (MLflow/Kubeflow/Databricks/SageMaker/Vertex;
Airflow/Prefect/DBT;
Argo CD/Flux;
Great Expectations/Evidently), normas de repositorios, templates (IaC, pipelines) y guardrails.
* Preventa y entrega: apoyo en Solution Briefs, estimaciones y arquitectura en propuestas;
handover a Delivery/Managed con documentación operativa.
* Formación: enablement a equipos (ingeniería, datos, preventa) para asegurar adopción homogénea de la plataforma y buenas prácticas.
Requisitos:
* 4+ años en plataformas de datos/ML y 3+ como arquitecto/a en entornos productivos.
* Experiencia sólida en al menos un cloud (Azure/AWS/GCP) y entornos híbridos/on‑prem.
* IaC (Terraform), Kubernetes (AKS/EKS/GKE/on‑prem), contenedores, redes y service mesh (deseable).
* Experiment tracking & registry (MLflow/Kubeflow/Databricks/SageMaker/Vertex ≥1), feature store y model serving.
* CI/CD & GitOps (GitHub/GitLab CI, Argo CD o Flux), testing de datos/modelos, blue‑green/canary.
* Streaming (Kafka/Flink) y data lakehouse (Delta/Snowflake/BigQuery) + SQL avanzado.
* Vector DB (pgvector/Milvus/Pinecone) y search hybrid para RAG.
* Observabilidad: Prometheus/Grafana/ELK + herramientas de calidad/monitor de modelos (Great Expectations/Evidently/Fiddler/WhyLabs…)
* Seguridad: KMS/Vault, RBAC/ABAC, TLS/MTLS, políticas, secret management;
nociones de RGPD y gestión de PII.
* Python y scripting (Bash), arquitectura de microservicios/API.
* Habilidades consultivas: trade‑offs, storytelling técnico, elaboración de SOW y documentación clara.
Plus (nice‑to‑have):
* Air‑gapped (defensa/administración), GPU scheduling (NVIDIA, MIG), NIM/Triton, A100/H100.
* Edge AI (Jetson/Orin), TensorRT/OpenVINO, QoS en enlaces inestables.
* Gobierno de datos (Collibra/Atlan), data lineage, DBT, DQ at scale.
* Normativa: AI Act UE, ISO 27001/42001, MDR/Machinery (para soluciones sanitarias/robóticas), ENS (español) y contratación pública.
* Integraciones verticales: HL7/FHIR/DICOM (salud), SCADA/OPC‑UA (industria), core insurance (seguros).Ç
Beneficios:
Sé parte de una empresa multinacional en constante crecimiento.