求人詳細 2026年5月

GPU Systems Engineer

雇用形態 正社員(EOI) 勤務地 リモート スケジュール ビジネスアワー+オンコールローテーション 日付 2026年5月23日

ポジションについて

これは意向確認(Expression of Interest)であり、現在募集中のポジションではありません。

私たちはAMD InstinctおよびNvidia HGXクラスのハードウェアでGPUクラスターを運用しています。システムエンジニアリングの業務は、ファームウェアおよびROCmまたはCUDAスタックから、ファブリック、光学系、RDMA、ストレージを経て、テナント対応クラスターまでの全工程を含みます。

意味のある規模での本番GPUシステムの構築または運用経験があれば、ぜひご連絡ください。

職務内容

  • 新規GPUクラスターの立ち上げ:ファームウェア、BIOS、ドライバースタック、ファブリック設定、検証。
  • クラスターレベルでのRDMA、RoCE、NCCLまたはRCCLの動作チューニングとトラブルシューティング。
  • テナント全体でのROCm、CUDAおよびサポートライブラリスタックの運用。
  • プラットフォーム、ネットワーク、DCチームとのキャパシティ、信頼性、ハードウェア交換の調整。
  • 次のオペレーターが参照するランブックの作成。

必須スキルと経験

  • AMD InstinctまたはNvidia HGXクラスの本番GPUクラスターの実践的な経験。
  • 強力なLinuxの基礎、カーネルおよびドライバーレベルのトラブルシューティング。
  • RDMAファブリック設計、NCCLまたはRCCLチューニング、マルチノードトレーニングパフォーマンスの理解。
  • ファームウェアアップデート、ハードウェア診断、ベンダーエスカレーションへの対応。
  • 体系的な思考。部品を交換するのではなく、変数を特定できる方。

OneQodeについて

OneQodeは、パフォーマンスデジタルインフラのグローバルプロバイダーです。cloudコンピュート、低レイテンシネットワーキング、5大陸30以上のデータセンターにわたるソブリンテクノロジーを統合した垂直統合プラットフォームにより、エンタープライズ、政府、パフォーマンスを追求する企業がAIおよびミッションクリティカルなワークロードをグローバルに大規模で実行できるよう支援しています。

応募方法

ご自身に合うと感じたら、ぜひご連絡ください。

下のボタンをクリックしてご応募ください。

browse similar roles
  • NOC Engineer

    雇用形態 フルタイム(契約) 勤務地 リモート(マレーシア) 勤務体系 24時間365日シフト制 日付

  • Solutions Architect

    雇用形態 正社員 勤務地 リモート(APAC優遇) 勤務体系 通常勤務時間 日付

  • Cloud Platform Engineer

    雇用形態 フルタイム 勤務地 リモート 勤務体系 標準的な営業時間 日付

  • PR & Narrative Lead

    雇用形態 正社員 勤務地 リモート(APACタイムゾーン優遇) 勤務体系 通常勤務時間 日付

  • Enterprise Sales

    雇用形態 フルタイム 勤務地 米国、ASEANまたはヨーロッパ 勤務体系 担当地域に合わせたシフト 日付

  • Executive Assistant

    雇用形態 フルタイム 勤務地 リモート(APACタイムゾーン) 勤務体系 標準営業時間 日付

  • Head of People

    雇用形態 正社員 勤務地 リモート 勤務体系 通常勤務時間 日付

  • Legal Counsel

    雇用形態 正社員 勤務地 リモート 勤務体系 標準ビジネスアワー 日付

  • Datacenter Operations Engineer

    雇用形態 フルタイム 勤務地 バンコク、タイ 勤務体系 オンサイト・オンコールローテーション 日付

はじめる準備はできていますか?

次のデプロイについて、インフラチームにご相談ください。