Talent Insights somos una Agencia de Networking especializada en Tecnología y mundo Digital. Nuestro reto es actuar como partner estratégico en proyectos de crecimiento y mejora tanto para profesionales como para empresas a través de procesos de selección personalizados y altamente especializados.
Desplácese hacia abajo para encontrar una descripción detallada de este trabajo y lo que se espera de los candidatos. Envíe su solicitud haciendo clic en el botón "Solicitar".
Estamos colaborando con una empresa del sector computational chemistry y desarrollo de plataformas SaaS científicas, especializada en herramientas de modelado molecular e inteligencia artificial para acelerar el diseño de nuevos materiales y compuestos más sostenibles.
Para su equipo técnico queremos incorporar una persona que pueda desenvolverse como HPC Sysadmin. Es un perfil clave ligado a la infraestructura y evolución de la plataforma tecnológica, responsable de garantizar la disponibilidad, rendimiento y escalabilidad de los entornos HPC, actuando como referente técnico dentro del equipo.
Sus principales funciones se focalizarán en:
A nivel de infraestructura y operaciones
- Administración y evolución de clústeres HPC on-premise (hardware, networking, alta disponibilidad y monitorización).
- Gestión avanzada y optimización de Slurm (scheduling policies, QoS, fairshare, capacity planning y troubleshooting de rendimiento).
- Diseño y operación de sistemas de almacenamiento distribuido (Lustre, BeeGFS, Ceph o equivalentes).
- Automatización e Infraestructura como Código (Pulumi, Ansible, Packer o similares).
- Administración avanzada de sistemas Linux (Rocky Linux, AlmaLinux), incluyendo hardening y buenas prácticas de seguridad.
- Gestión de entornos de virtualización y contenedores (Proxmox, Docker/Podman) y herramientas de provisión (xCAT, Foreman o similares).
- Monitorización y reporting con herramientas como Grafana, Prometheus, XDMoD o equivalentes.
A nivel de evolución y mejora de la plataforma
- Participar en la planificación y diseño de la plataforma computacional.
- Tomar decisiones técnicas para avanzar la infraestructura y su escalabilidad.
- Extensión de entornos HPC on-premise hacia la nube (AWS bursting, configuraciones híbridas con Slurm, optimización de rendimiento y costes).
- Colaboración transversal con equipos científicos y de desarrollo para garantizar la eficiencia de los workloads, especialmente en entornos con alta carga GPU.
- Participación en proyectos complejos de infraestructura end-to-end.
Para poder responder al rol, creemos imprescindible:
- +4 años de experiencia gestionando y evolucionando clústeres HPC on-premise.
- Experiencia sólida administrando Slurm a escala.
- Experiencia en almacenamiento distribuido para HPC.
- Conocimientos sólidos en automatización y scripting (Bash, Python o similares).
- Experiencia en virtualización, contenedores y herramientas de provisión.
- Experiencia en entornos Linux empresariales.
- Capacidad de trabajo autónomo y colaboración en equipos multidisciplinares.
- Inglés profesional.
Soft Skills: autonomía, pensamiento analítico, orientación a rendimiento y mejora continua, capacidad de comunicación técnica y toma de decisiones.
Las condiciones que podemos compartir:
- Posición full-time.
- Ubicación: Barcelona.
- Propuesta estable e incorporación directa en una compañía tecnológica con producto propio y alto impacto científico. xqbhyrx
- Remuneración competitiva acorde a experiencia.