detalles del puesto mayo 2026

GPU Systems Engineer

tipo Tiempo completo (EOI) ubicación Remoto horario Horario laboral con rotación de guardia fecha 23 de mayo de 2026

Sobre el puesto

Esta es una Expresión de Interés, no un puesto activo.

Operamos clústeres GPU con hardware AMD Instinct y Nvidia HGX-class. El trabajo de ingeniería de sistemas abarca desde el firmware y los stacks de ROCm o CUDA, pasando por la fabric, la óptica, RDMA y el almacenamiento, hasta los clústeres listos para inquilinos.

Si has construido u operado sistemas GPU en producción a escala significativa, queremos conocerte.

Responsabilidades

  • Poner en marcha nuevos clústeres GPU: firmware, BIOS, stack de drivers, configuración de fabric, validación.
  • Ajustar y solucionar problemas de RDMA, RoCE y el comportamiento de NCCL o RCCL a nivel de clúster.
  • Operar ROCm, CUDA y el stack de librerías de soporte entre inquilinos.
  • Coordinarse con los equipos de plataforma, red y DC en capacidad, fiabilidad e intercambio de hardware.
  • Redactar los runbooks de los que dependerá el próximo operador.

Habilidades y experiencia requeridas

  • Experiencia práctica con clústeres GPU en producción, AMD Instinct o Nvidia HGX-class.
  • Sólidos fundamentos en Linux, resolución de problemas a nivel de kernel y drivers.
  • Comprensión del diseño de fabric RDMA, ajuste de NCCL o RCCL y rendimiento de entrenamiento multi-nodo.
  • Comodidad con actualizaciones de firmware, diagnósticos de hardware y escaladas a fabricantes.
  • Metódico. Aislas la variable en lugar de cambiar la pieza.

Sobre OneQode

OneQode es un proveedor global de infraestructura digital de alto rendimiento. Con una plataforma verticalmente integrada que abarca cómputo cloud, redes de baja latency y tecnología soberana en más de 30 datacenters en 5 continentes, permite a empresas, gobiernos y negocios con alta demanda de rendimiento ejecutar cargas de trabajo de IA y de misión crítica a escala, en todo el mundo.

Cómo postularse

Si esto encaja contigo, nos encantaría saber de ti.

Haz clic en el botón de abajo para postularte.

browse similar roles
  • NOC Engineer

    tipo Tiempo completo (Contrato) ubicación Remoto (Malasia) turno Rotación de turnos 24x7 fecha

  • Solutions Architect

    tipo Tiempo completo ubicación Remoto (APAC preferido) turno Horario comercial estándar fecha

  • Cloud Platform Engineer

    tipo Tiempo completo ubicación Remoto turno Horario laboral estándar fecha

  • PR & Narrative Lead

    tipo Tiempo completo ubicación Remoto (zona horaria APAC preferida) turno Horario comercial estándar fecha

  • Enterprise Sales

    tipo Tiempo completo ubicación EE. UU., ASEAN o Europa turno Alineado a la región objetivo fecha

  • Executive Assistant

    tipo Tiempo completo ubicación Remoto (zona horaria APAC) turno Horario comercial estándar fecha

  • Head of People

    tipo Tiempo completo ubicación Remoto turno Horario comercial estándar fecha

  • Legal Counsel

    tipo Tiempo completo ubicación Remoto turno Horario laboral estándar fecha

  • Datacenter Operations Engineer

    tipo Tiempo completo ubicación Bangkok, Tailandia turno Presencial con rotación de guardia fecha

¿Listo para comenzar?

Habla con nuestro equipo de infraestructura sobre tu próximo despliegue.