Grafton es una compañía dedicada a la captación de talento y a la búsqueda y selección de mandos intermedios. Somos parte de Gi Group, una de las multinacionales de referencia ofreciendo soluciones personalizadas de Recursos Humanos. Desde Grafton buscamos un
DevOps/SRE.
Sobre el rol
Buscamos incorporar a nuestro equipo un/a DevOps / Site Reliability Engineer (SRE) –
Mid/Senior, que ayude a diseñar, automatizar y operar nuestra plataforma cloud con
foco en confiabilidad, escalabilidad, seguridad y eficiencia de costes.
Trabajaría estrechamente con equipos de desarrollo para mejorar la entrega continua,
reducir fricción operativa y aumentar la estabilidad de los servicios en producción.
Responsabilidades principales
* Diseñar, implementar y mantener infraestructura siguiendo principios de
Infrastructure as Code (IaC).
* Gestionar y evolucionar entornos en AWS, garantizando buenas prácticas en:
* seguridad y control de accesos (IAM, networking, etc.)
* escalabilidad y resiliencia
* estandarización y automatización
* Construir, mantener y mejorar pipelines CI/CD y automatismos asociados al
ciclo de vida de aplicaciones.
* Implementar y operar procesos de Continuous Delivery usando herramientas
GitOps Como
* ArgoCD
* Helm
* Operar y administrar clústeres Kubernetes, incluyendo troubleshooting y
mejoras continuas.
* Implementar automatismos y tooling interno mediante scripting (Python) para
mejorar procesos operativos y reducir trabajo manual.
* Participar en prácticas SRE para operación y mejora continua:
* gestión de incidentes y troubleshooting en producción
* creación y mantenimiento de runbooks
* postmortems y acciones correctivas/preventivas
* definición y mejora de alerting y monitoreo
* Colaborar en iniciativas de optimización de costes (FinOps):
* visibilidad de gasto
* ajuste de recursos y escalado
* recomendaciones para eficiencia cloud
* buenas prácticas de etiquetado y ownership
Requisitos técnicos (imprescindibles)
* Experiencia práctica con Terraform (idealmente también Terragrunt).
* Familiaridad con el ecosistema de AWS (por ejemplo: IAM, VPC, EC2, S3,
CloudWatch, RDS, EKS, etc.).
* Experiencia en el diseño e implementación de pipelines CI/CD.
* Buen manejo de GitHub y GitHub Actions.
* Conocimientos sólidos de Kubernetes (deployments, services, ingress,
troubleshooting).
* Experiencia aplicando prácticas SRE:
* operación de servicios
* respuesta a incidentes
* mejoras de confiabilidad y automatización
* Capacidad de escribir scripts y herramientas usando Python para
automatización y mejora de procesos.
* Comunicación fluida en español e inglés (oral y escrito).
Requisitos deseables (nice to have)
* Experiencia con ArgoCD y enfoque GitOps (PR-driven deployments).
* Experiencia con Helm (charts, values, releases, upgrade strategies).
* Conocimientos de observabilidad:
* métricas, logs y trazas (Prometheus/Grafana, CloudWatch,
ELK/OpenSearch, etc.)
* Conocimientos de seguridad en cloud:
* least privilege, hardening, secret management
* Experiencia en prácticas FinOps:
* rightsizing, budgets/alerts, cost allocation, reserved instances / savings
plans (si aplica)
* Experiencia con herramientas como:
* AWS Systems Manager, Secrets Manager / Parameter Store
* autoscaling (HPA/KEDA), load balancing, DNS, TLS
Perfil buscado
* Mentalidad de automatización: reducir tareas repetitivas y mejorar la eficiencia.
* Orientación a estabilidad y operación: foco en prevenir incidentes y mejorar
resiliencia.
* Capacidad de colaborar con equipos de desarrollo y traducir necesidades a
soluciones escalables.
* Buen criterio técnico para balancear rapidez vs. robustez.
* Autonomía y ownership en los proyectos asignados.