Sobre Planimatik
Planimatik es una plataforma SaaS operando sobre AWS. Nuestro stack combina entrega de frontend vía CloudFront + S3, backend en EC2 ejecutando Docker (Symfony), capa de datos con PostgreSQL (principal + read replica ), Redis y RabbitMQ, y observabilidad con Prometheus, Loki, Grafana y Metabase. Buscamos incorporar un/a perfil senior que lidere la evolución de la plataforma, su seguridad y su escalabilidad.
Misión del puesto
Liderar el área de infraestructura y seguridad cloud, elevando la fiabilidad, automatización, observabilidad y resiliencia de nuestros entornos en AWS. Tendrás ownership técnico del stack de plataforma, impulsarás mejoras de arquitectura y establecerás estándares y procesos para operación y entrega (CI/CD), garantizando continuidad y escalabilidad del servicio.
Responsabilidades
* Diseñar, mantener y evolucionar la infraestructura en AWS (red, compute, storage, edge/CDN), garantizando disponibilidad, rendimiento y eficiencia de costes.
* Mejorar fiabilidad y escalabilidad con enfoque SRE : SLO/SLI, capacity planning, eliminación de SPOFs, y mejora continua.
* Implantar y mantener controles de seguridad: IAM, cifrado, hardening, segmentación de red, logging/auditoría, y gestión de secretos.
* Fortalecer CI/CD (GitLab) y estandarizar despliegues reproducibles; avanzar en automatización e infraestructura como código.
* Consolidar la observabilidad : métricas, logs, alertas; reducir “alert fatigue” y mejorar tiempos de detección/recuperación.
* Operar y optimizar servicios core: PostgreSQL (backups/restores, réplica, tuning), Redis, RabbitMQ, y el runtime Docker.
* Definir y probar procedimientos de continuidad y recuperación (backup/restore, DR), ejecutando simulacros y revisiones.
* Gestionar vulnerabilidades y ciclo de parcheo; coordinar mejoras de hardening y revisiones periódicas.
* Participar en guardias on-call compartidas, liderando la respuesta a incidentes cuando corresponda y promoviendo post-mortems y acciones correctivas.
* Liderazgo técnico: documentación, estándares, mentoría, priorización y coordinación con el resto del equipo.
Requisitos (imprescindibles)
* +5 años de experiencia en infraestructura/DevOps/SRE, con al menos 3–4 años en AWS en entornos productivos.
* Dominio práctico de:
* AWS (EC2, VPC, S3, CloudFront, IAM; y servicios relacionados de seguridad/monitorización).
* Linux (admin avanzada, hardening, troubleshooting).
* Docker (operación, builds, runtime).
* PostgreSQL (operación, backups/restores, replicación, performance básico).
* Redis y RabbitMQ (operación y troubleshooting).
* GitLab CI/CD (pipelines, runners, despliegues).
* Observabilidad con Prometheus/Grafana y logging (idealmente Loki).
* Experiencia real gestionando incidentes en producción y participando en rotaciones on-call.
* Capacidad demostrable para liderar técnicamente: ownership, comunicación, toma de decisiones y priorización.
Se valora especialmente
* IaC (Terraform/CloudFormation) y automatización (Ansible u otras).
* Experiencia con controles de seguridad cloud avanzados (WAF, posture, auditoría, benchmarks, etc.).
* Experiencia en optimización de costes (FinOps).
* Experiencia en SaaS B2B con requisitos de auditoría de proveedor.
* Conocimientos de Kubernetes/ECS (si se evalúa evolución futura).