À propos du poste
Nous construisons l'équipe qui possède notre plateforme cloud interne de bout en bout.
Le travail est divisé en deux parties. La majorité du temps, vous construisez et opérez la couche d'orchestration qui s'étend sur notre flotte GPU et CPU, incluant l'isolation des locataires, le réseau, l'observabilité et les outils opérationnels associés. Le reste du temps, vous êtes en contact avec les clients et l'entreprise au sens large, aidant à définir ce que la plateforme doit faire ensuite.
Si vous avez opéré Kubernetes à grande échelle sur bare metal, c'est votre domaine.
Responsabilités
- Concevoir, déployer et opérer le plan de contrôle cloud sur les régions et les types de locataires.
- Gérer le cycle de vie des clusters : provisionnement, mises à jour, opérations J+2 et décommissionnement.
- Construire des outils internes qui réduisent les tâches répétitives pour les équipes opérationnelles et en contact avec les clients.
- Collaborer avec les ventes et le produit pour orienter les capacités de la plateforme en fonction de la demande réelle des clients.
- Contribuer à la mise sur le marché, au contenu technique et aux engagements clients si utile.
Compétences et expérience requises
- Une expérience Kubernetes en production est indispensable.
- Une expérience en bare metal, IaaS ou ingénierie de plateforme est importante.
- Expérience dans l'exploitation de systèmes à grande échelle : grands clusters GPU, supercalcul ou mainframes.
- À l'aise avec les couches de calcul, de stockage, de réseau et d'identité.
- Solides fondamentaux Linux et infrastructure-as-code.
- Pragmatique. Prêt à effectuer le travail ingrat qui rend une plateforme fiable.
- Volonté d'interagir avec les clients, les ventes et le produit, pas seulement avec l'ingénierie.
Compétences souhaitables / bonus
- Expérience préalable chez un fournisseur cloud.
- Familiarité avec le réseau multi-locataires, les tissu RDMA et la planification spécifique aux GPU.
À propos de OneQode
OneQode est un fournisseur mondial d'infrastructure numérique haute performance. Avec une plateforme verticalement intégrée couvrant le calcul cloud, le réseau à faible latency et la technologie souveraine dans plus de 30 datacentres sur 5 continents, ils permettent aux entreprises, aux gouvernements et aux organisations avides de performance d'exécuter des charges de travail IA et critiques à grande échelle, partout dans le monde.
Comment postuler
Si ce poste vous correspond, nous serions ravis de vous entendre.
Cliquez sur le bouton ci-dessous pour postuler.