求人詳細 2026年5月

GPU Systems Engineer

雇用形態 正社員(EOI) 勤務地 リモート スケジュール ビジネスアワー+オンコールローテーション 日付 2026年5月23日

ポジションについて

これは意向確認(Expression of Interest)であり、現在募集中のポジションではありません。

私たちはAMD InstinctおよびNvidia HGXクラスのハードウェアでGPUクラスターを運用しています。システムエンジニアリングの業務は、ファームウェアおよびROCmまたはCUDAスタックから、ファブリック、光学系、RDMA、ストレージを経て、テナント対応クラスターまでの全工程を含みます。

意味のある規模での本番GPUシステムの構築または運用経験があれば、ぜひご連絡ください。

職務内容

  • 新規GPUクラスターの立ち上げ:ファームウェア、BIOS、ドライバースタック、ファブリック設定、検証。
  • クラスターレベルでのRDMA、RoCE、NCCLまたはRCCLの動作チューニングとトラブルシューティング。
  • テナント全体でのROCm、CUDAおよびサポートライブラリスタックの運用。
  • プラットフォーム、ネットワーク、DCチームとのキャパシティ、信頼性、ハードウェア交換の調整。
  • 次のオペレーターが参照するランブックの作成。

必須スキルと経験

  • AMD InstinctまたはNvidia HGXクラスの本番GPUクラスターの実践的な経験。
  • 強力なLinuxの基礎、カーネルおよびドライバーレベルのトラブルシューティング。
  • RDMAファブリック設計、NCCLまたはRCCLチューニング、マルチノードトレーニングパフォーマンスの理解。
  • ファームウェアアップデート、ハードウェア診断、ベンダーエスカレーションへの対応。
  • 体系的な思考。部品を交換するのではなく、変数を特定できる方。

OneQodeについて

OneQodeは、パフォーマンスデジタルインフラのグローバルプロバイダーです。cloudコンピュート、低レイテンシネットワーキング、5大陸30以上のデータセンターにわたるソブリンテクノロジーを統合した垂直統合プラットフォームにより、エンタープライズ、政府、パフォーマンスを追求する企業がAIおよびミッションクリティカルなワークロードをグローバルに大規模で実行できるよう支援しています。

応募方法

ご自身に合うと感じたら、ぜひご連絡ください。

下のボタンをクリックしてご応募ください。

browse similar roles

NOC Engineer

雇用形態 フルタイム(契約) 勤務地 リモート(マレーシア) 勤務体系 24時間365日シフト制 日付

Solutions Architect

雇用形態 正社員 勤務地 リモート(APAC優遇) 勤務体系 通常勤務時間 日付

Cloud Platform Engineer

雇用形態 フルタイム 勤務地 リモート 勤務体系 標準的な営業時間 日付

PR & Narrative Lead

雇用形態 正社員 勤務地 リモート(APACタイムゾーン優遇) 勤務体系 通常勤務時間 日付

Enterprise Sales

雇用形態 フルタイム 勤務地 米国、ASEANまたはヨーロッパ 勤務体系 担当地域に合わせたシフト 日付

Executive Assistant

雇用形態 フルタイム 勤務地 リモート(APACタイムゾーン) 勤務体系 標準営業時間 日付

Head of People

雇用形態 正社員 勤務地 リモート 勤務体系 通常勤務時間 日付

Legal Counsel

雇用形態 正社員 勤務地 リモート 勤務体系 標準ビジネスアワー 日付

Datacenter Operations Engineer

雇用形態 フルタイム 勤務地 バンコク、タイ 勤務体系 オンサイト・オンコールローテーション 日付

はじめる準備はできていますか?

次のデプロイについて、インフラチームにご相談ください。