Des de Agap2 buscamos incorporar un/a Site Reliability Engineer para formar parte de un equipo fundamental dentro del área de Plataforma y Seguridad de una importante compañía tecnológica líder en Europa.Se trata de una posición estratégica enfocada en garantizar la fiabilidad, escalabilidad y eficiencia de una infraestructura que soporta cientos de microservicios en producción.Ubicación: 100% remoto (candidatos/as basados en Europa)Misión: Asegurar la operación sostenible y fiable de la plataforma tecnológica, definiendo estándares, procesos y herramientas que faciliten la entrega de valor por parte de los equipos de ingeniería.Responsabilidades:Definir y mantener herramientas, procesos y estándares para el despliegue y operación de la plataforma.Garantizar la fiabilidad y escalabilidad de más de 400 servicios en producción.Liderar análisis de causa raíz (RCA) y la resolución de incidencias de rendimiento y escalabilidad.Documentar post-mortems y promover la mejora continua.Contribuir a una cultura sostenible de guardias (on-call), mejorando runbooks y sistemas de alertado.Colaborar con equipos de desarrollo y datos para integrar prácticas DevOps y de fiabilidad.Promover la cultura SRE dentro de los equipos de ingeniería.Mentorar a otros perfiles técnicos en observabilidad, resiliencia y buenas prácticas DevOps.Requisitos:+3 años de experiencia en SRE, DevOps o ingeniería de infraestructuras.Sólida base en sistemas Linux, networking en la nube y operaciones.Experiencia en AWS (imprescindible).Conocimiento en Kubernetes, Docker, Helm, Nginx, Redis y GitLab (SCM & CI/CD).Experiencia con PostgreSQL (imprescindible), MySQL y Kafka.Infraestructura como código con Terraform (imprescindible).Experiencia en CI/CD con GitLab CI.Conocimientos en monitorización y observabilidad (Datadog, APM, logs, dashboards, SLO/SLA).Experiencia con arquitecturas de microservicios y APIs a gran escala.Conocimiento de Service Mesh (Istio, Envoy) valorable.Experiencia