¿A qué nos dedicamos?
Datadope ofrece analítica operacional inteligente y soluciones de monitorización que ayudan a nuestros clientes a mejorar la visibilidad de sus servicios y procesos de negocio para mejorar la productividad, la eficiencia operacional y por tanto reducir mantenimiento y costes.
Necesitamos personas sin miedo, que estén dispuestas a alcanzar lo imposible porque sabemos que en el camino hacia lo imposible se encuentran soluciones inesperadas.
Buscamos un SRE Senior enfocado en el soporte, la implementación, optimización y automatización de soluciones de monitorización y observabilidad en entornos on-premise y cloud.
El candidato ideal debe contar con habilidades en infraestructura, automatización e integración de herramientas de observabilidad, además de capacidad para resolver problemas, trabajar en equipo y tratar con clientes de manera efectiva.
FUNCIONES:
* Implementar y optimizar soluciones de monitorización y observabilidad en infraestructuras híbridas (on-premise y cloud).
* Desplegar y configurar herramientas como Zabbix, Prometheus, Grafana, Elastic Stack, Loki y otros.
* Automatizar procesos de monitorización y configuración de infraestructura mediante Ansible, Terraform o similares.
* Garantizar la estabilidad y el rendimiento del entorno de monitorización y los sistemas monitorizados.
* Implementar y gestionar sistemas de alertado dinámico y predictivo mediante análisis de datos.
* Desarrollar dashboards técnicos, funcionales y ejecutivos integrando diversas fuentes de datos en Grafana.
* Gestionar infraestructura en AWS, Azure y GCP, incluyendo Kubernetes y Docker.
* Administrar bases de datos relacionales y de series temporales como PostgreSQL, MySQL, InfluxDB y Prometheus.
* Impulsar prácticas SRE para potenciar el uso de la automatización y simplificar las tareas rutinarias, desarrollando scripts y herramientas.
* Realizar tareas de soporte diarias, como resolver incidencias, tramitar solicitudes de cambio y acometer acciones de mantenimiento preventivo.
* Desarrollar, mantener y evaluar las métricas necesarias para prestar un soporte 24/7.
CONOCIMIENTOS/EXPERIENCIA MÍNIMOS:
* 4 años de experiencia en soporte, automatización y optimización de implantaciones críticas sobre grandes infraestructuras
* Experiencia en administración de sistemas Linux/Unix.
* Conocimientos en scripting y automatización con Python, Bash, Shell scripting.
* Administración de entornos cloud:
AWS, Azure, Google Cloud, Oracle Cloud
* Experiencia con CI/CD (Jenkins, ArgoCD, GitOps).
* Manejo avanzado de monitorización y logging con herramientas como Prometheus, Thanos, Zabbix, Elastic Stack, Loki, Redis, Metricbeat, Filebeat.
CONOCIMIENTOS DESEABLES
* Conocimientos en Infraestructura como Código (Terraform, Ansible, Kustomize).
* Administración de Kubernetes y orquestación de contenedores (Docker, OpenShift, Fleet/OSquery).
* Machine Learning
* Deseable titulación universitaria en Informática, Telecomunicaciones o similar.
¿Qúe ofrecemos?
* Trabajo 100% Remoto