Sobre nosotros En GPU Solutions operamos infraestructura de cómputo de última generación, incluyendo NVIDIA B200, para servir modelos de IA en producción.
Por favor, lea detenidamente la información de esta oferta de empleo para entender exactamente qué se espera de los posibles candidatos.
Somos un equipo pequeño donde cada persona tiene impacto directo sobre el producto y las decisiones técnicas.
El puesto Buscamos a alguien al inicio de su carrera con ganas de especializarse en inference serving sobre hardware top de gama.
Vas a trabajar mano a mano con modelos de lenguaje y visión grandes, desplegándolos, optimizándolos y midiendo su rendimiento sobre B200.
No te vamos a pedir que llegues sabiéndolo todo: te vamos a pedir que aprendas rápido y traigas iniciativa.
Qué harás Desplegar y servir modelos (LLMs, VLMs, modelos de difusión) usando frameworks como v LLM, Tensor RT-LLM, SGLang o Triton Inference Server.
Optimizar latencia y throughput mediante cuantización (FP8, INT4), batching dinámico y paralelismo de tensores.
Monitorizar GPUs, diagnosticar cuellos de botella y comparar configuraciones.
Automatizar despliegues con Docker, Kubernetes y CI/CD.
Colaborar con clientes para entender sus necesidades de inferencia y proponer soluciones.
Lo que buscamos Grado en Informática, Telecos, Matemáticas, Física o equivalente (o bootcamp + proyectos serios).
Python sólido y soltura en Linux.
Familiaridad con conceptos de deep learning y arquitecturas tipo Transformer.
Curiosidad por el hardware: saber qué es VRAM, ancho de banda de memoria, NVLink, y por qué importan.
Mentalidad de builder: side projects, contribuciones open source, hackathons, repos propios en Git Hub.
Capacidad de moverte solo/a con documentación nueva y mucha autonomía.
Bonus (no requerido) CUDA básico, experiencia previa con v LLM o servir modelos en local, contribuciones a proyectos de inference, haber hecho fine-tuning o cuantización, conocimientos de networking (RDMA, Infini Band).
Qué ofrecemos Acceso a hardware NVIDIA B200 desde el día 1.
Trabajar con los modelos más punteros del mercado.
Aprendizaje brutal en un nicho con muchísima demanda y poca gente formada en España.
Plan de carrera real con incremento salarial ligado a impacto.
Híbrido en Madrid (no se contempla 100% remoto). xpzdshu
Equipo pequeño, sin burocracia, decisiones rápidas.