Desde Alcorce Telecomunicaciones, empresa con más de 15 años de experiencia en el Sector IT, buscamos un/a Incident Manager con nivel de ingles alto para uno de nuestros principales proyectos internacionales en modalidad 100% remoto.
Funciones principales:
* Liderar la gestión de incidentes críticos de infraestructura y servicios, coordinando la respuesta, recuperación y prevención de recurrencias.
* Supervisar la operación de cargas de trabajo empresariales en la nube, garantizando su confiabilidad, disponibilidad y escalabilidad.
* Analizar, resolver y documentar incidentes complejos en entornos de alta presión, asegurando la mínima interrupción del servicio.
* Monitorear el rendimiento de sistemas mediante herramientas de observabilidad (Dynatrace, CloudWatch, OpenSearch, etc.) para detectar y prevenir degradaciones.
* Comunicar eficazmente con las partes interesadas, incluyendo altos directivos, elaborando informes de incidentes, análisis de causa raíz y métricas operativas.
Requisitos técnicos y habilidades:
* Experiencia sólida en administración de sistemas (Linux/Windows) y prácticas de Site Reliability Engineering (SRE) en entornos cloud.
* Conocimiento profundo en herramientas de monitoreo y registro (Dynatrace, CloudWatch, OpenSearch u otras similares).
* Dominio en gestión de incidentes y control de cambios, incluyendo liderazgo en la recuperación ante caídas de infraestructura.
* Excelentes habilidades de resolución de problemas y capacidad para diagnosticar sistemas complejos bajo presión.
* Nivel alto de inglés;
conocimiento en la suite Office 365 y habilidades de presentación efectivas.
¡Si te interesa la oportunidad no dudes en apuntarte!