Responsabilidades del Rol
- Garantizar disponibilidad y estabilidad de plataformas críticas
- Gestión y resolución de incidencias complejas
- Automatización operativa
- Mejora continua de fiabilidad y observabilidad
- Análisis RCA y postmortems
- Optimización performance y capacidad
- Colaboración con equipos de desarrollo y arquitectura
Stack principal
- AWS Cloud
- Aplicaciones Java
- Bases de datos:
- Aurora
- Oracle
Tecnologías relevantes
- Linux
- Docker / Kubernetes
- Terraform
- CI/CD
- Monitoring & Observability
Perfil RequeridoExperiencia
- Más 3 años en roles:
- SRE
- DevOps
- Platform Engineering
- Producción/Operaciones Cloud
Conocimientos Técnicos Obligatorios
Cloud & Infraestructura
- AWS avanzado:
- EC2
- RDS/Aurora
- I AM
- EKS
- ECS
Sistemas Linux
- Administración Linux avanzada
Java
- Experiencia trabajando sobre plataformas Java:
- Análisis de performance
- Troubleshooting de aplicaciones
Base de datos
- Tener conocimiento básico de SQL para poder revisar si hay algún error con las BBDD implicadas.
Monitoring & Observability
- Experiencia con herramientas tipo:
- Prometheus
- Grafana
- ELK/OpenSearch
- Datadog
- Dynatrace
- CloudWatch
- Capacidad para:
- definir alertas accionables
- troubleshooting end-to-end
- observabilidad de plataformas distribuidas
CI/CD
- Conocimiento en:
- GitHub Actions
- GitLab CI/CD
Ofrecemos
- Formación a medida. Contamos con va