DevOps / Site Reliability Engineer (SRE) – Mid/Senior
Ubicación:
Remoto / Híbrido (según necesidad)
Tipo de puesto:
Contrato indefinido
Nivel:
Mid–Senior
Departamento:
Ingeniería / Cloud & Platform
Buscamos incorporar a nuestro equipo un/a
DevOps / Site Reliability Engineer (SRE)
con experiencia en entornos Cloud (AWS), automatización e infraestructura como código. La persona seleccionada trabajará estrechamente con nuestros equipos de desarrollo para mejorar la entrega continua, fortalecer la confiabilidad operativa y optimizar la plataforma tanto en escalabilidad como en costes.
Responsabilidades principales
* Diseñar, implementar y mantener infraestructura cloud utilizando
Infrastructure as Code (IaC)
, preferentemente con
Terraform
y
Terragrunt
.
* Gestionar y evolucionar entornos en
AWS
(IAM, VPC, EC2, S3, CloudWatch, RDS, EKS, entre otros).
* Construir y mejorar
pipelines CI/CD
, especialmente con
GitHub Actions
.
* Implementar procesos GitOps utilizando
ArgoCD
y
Helm
.
* Administrar y operar clústeres
Kubernetes
: deployments, services, ingress y troubleshooting.
* Automatizar tareas y crear herramientas internas mediante scripting en
Python
.
* Participar activamente en prácticas
SRE
: gestión de incidentes, postmortems, runbooks y mejora continua de sistemas.
* Colaborar en iniciativas
FinOps
para optimización de costes cloud.
Requisitos imprescindibles
* Experiencia demostrable con
Terraform (y/o Terragrunt).
* Experiencia sólida con
AWS
y su ecosistema.
* Conocimientos avanzados de
CI/CD
y
GitHub Actions
.
* Buen dominio de
Kubernetes
en producción.
* Experiencia real aplicando
prácticas SRE
.
* Conocimientos de
Python
para automatizació).
* Comunicación fluida en
español e inglés
(oral y escrito).
Requisitos deseables (Nice to have)
* Experiencia con
ArgoCD
,
Helm
y enfoque GitOps.
* Experiencia en observabilidad: Prometheus, Grafana, CloudWatch, ELK/OpenSearch.
* Conocimientos de seguridad cloud: hardening, least privilege, secret management.
* Experiencia con FinOps: cost allocation, rightsizing, budgets/alerts.
* Conocimientos de autoscaling (HPA/KEDA), DNS, TLS o AWS Systems Manager.