Grafton es una compañía dedicada a la captación de talento y a la búsqueda y selección de mandos intermedios. Somos parte de Gi Group, una de las multinacionales de referencia ofreciendo soluciones personalizadas de Recursos Humanos. Desde Grafton buscamos un
DevOps/SRE.
Sobre el rol
Buscamos incorporar a nuestro equipo un/a DevOps / Site Reliability Engineer (SRE) –
Mid/Senior, que ayude a diseñar, automatizar y operar nuestra plataforma cloud con
foco en confiabilidad, escalabilidad, seguridad y eficiencia de costes.
Trabajaría estrechamente con equipos de desarrollo para mejorar la entrega continua,
reducir fricción operativa y aumentar la estabilidad de los servicios en producción.
Responsabilidades principales
- Diseñar, implementar y mantener infraestructura siguiendo principios de
Infrastructure as Code (IaC).
- Gestionar y evolucionar entornos en AWS, garantizando buenas prácticas en:
- seguridad y control de accesos (IAM, networking, etc.)
- escalabilidad y resiliencia
- estandarización y automatización
- Construir, mantener y mejorar pipelines CI/CD y automatismos asociados al
ciclo de vida de aplicaciones.
- Implementar y operar procesos de Continuous Delivery usando herramientas
GitOps Como
- ArgoCD
- Helm
- Operar y administrar clústeres Kubernetes, incluyendo troubleshooting y
mejoras continuas.
- Implementar automatismos y tooling interno mediante scripting (Python) para
mejorar procesos operativos y reducir trabajo manual.
- Participar en prácticas SRE para operación y mejora continua:
- gestión de incidentes y troubleshooting en producción
- creación y mantenimiento de runbooks
- postmortems y acciones correctivas/preventivas
- definición y mejora de alerting y monitoreo
- Colaborar en iniciativas de optimización de costes (FinOps):
- visibilidad de gasto
- ajuste de recursos y escalado
- recomendaciones para eficiencia cloud
- buenas prácticas de etiquetado y ownership
Requisitos técnicos (imprescindibles)
- Experiencia práctica con Terraform (idealmente también Terragrunt).
- Familiaridad con el ecosistema de AWS (por ejemplo: IAM, VPC, EC2, S3,
CloudWatch, RDS, EKS, etc.).
- Experiencia en el diseño e implementación de pipelines CI/CD.
- Buen manejo de GitHub y GitHub Actions.
- Conocimientos sólidos de Kubernetes (deployments, services, ingress,
troubleshooting).
- Experiencia aplicando prácticas SRE:
- operación de servicios
- respuesta a incidentes
- mejoras de confiabilidad y automatización
- Capacidad de escribir scripts y herramientas usando Python para
automatización y mejora de procesos.
- Comunicación fluida en español e inglés (oral y escrito).
Requisitos deseables (nice to have)
- Experiencia con ArgoCD y enfoque GitOps (PR-driven deployments).
- Experiencia con Helm (charts, values, releases, upgrade strategies).
- Conocimientos de observabilidad:
- métricas, logs y trazas (Prometheus/Grafana, CloudWatch,
ELK/OpenSearch, etc.)
- Conocimientos de seguridad en cloud:
- least privilege, hardening, secret management
- Experiencia en prácticas FinOps:
- rightsizing, budgets/alerts, cost allocation, reserved instances / savings
plans (si aplica)
- Experiencia con herramientas como:
- AWS Systems Manager, Secrets Manager / Parameter Store
- autoscaling (HPA/KEDA), load balancing, DNS, TLS
Perfil buscado
- Mentalidad de automatización: reducir tareas repetitivas y mejorar la eficiencia.
- Orientación a estabilidad y operación: foco en prevenir incidentes y mejorar
resiliencia.
- Capacidad de colaborar con equipos de desarrollo y traducir necesidades a
soluciones escalables.
- Buen criterio técnico para balancear rapidez vs. robustez.
- Autonomía y ownership en los proyectos asignados.