AIコンピューティングハードウェア: ConnectX-8 SuperNIC

製品概要

ConnectX-8 SuperNIC は、次世代 AI コンピューティング クラスター、大規模データ センター、および高性能コンピューティング (HPC) シナリオ向けに設計された NVIDIA の第 400 世代スマート ネットワーク インターフェイス カードです。ネットワーク アクセラレーションと計算オフロード機能を深く統合し、800GbE/XNUMXGbE の超高速サポートを提供します。ハードウェア レベルのプロトコル オフロードと GPU-NIC の共同最適化により、ネットワーク遅延を大幅に削減し、スループット効率を向上させ、AI トレーニング、推論、および分散ストレージ シナリオ向けに超低遅延でロスレスのネットワーク伝送機能を提供します。

ConnectX-8 SuperNIC

ソフトウェアプロトコルとアクセラレーション機能

ConnectX-8 SuperNIC は、ソフトウェア プロトコル スタックとハードウェア アクセラレーション エンジンの緊密な連携により、フルスタック ネットワーク パフォーマンスを最適化します。

プロトコルサポート

  • RDMA/RoCEv2: リモート ダイレクト メモリ アクセス用の統合イーサネットに基づいており、サブマイクロ秒という低いレイテンシでゼロコピー データ転送を実現します。
  • GPUDirect テクノロジー: GPUDirect RDMA と GPUDirect ストレージをサポートし、CPU をバイパスして GPU からストレージ/NIC への直接的なデータやり取りを可能にします。
  • NVIDIA SHARPv3: AllReduce、ブロードキャスト、およびその他の操作をサポートする集約通信ハードウェア アクセラレーションにより、AI トレーニングの効率が向上します。
  • TLS/IPsec ハードウェア オフロード: パフォーマンスを低下させることなく、トラフィックの完全な暗号化と復号化をサポートします。

ソフトウェアエコシステム

  1. DOCA 2.0 (データセンター インフラストラクチャ オン チップ アーキテクチャ): ユーザー定義のデータ プレーン アクセラレーション機能 (DPU 共同オーケストレーションなど) をサポートする API 駆動型開発フレームワークを提供します。
  2. CUDA エコシステムとの緊密な統合: NCCL ライブラリを通じてマルチ GPU クロスノード通信の効率を最適化します。
ソフトウェアプロトコルとアクセラレーション機能

ハードウェアアーキテクチャと接続設計

ホストインターフェース

PCIe 5.0 x16、理論上の帯域幅 128GB/s、400G/800G ネットワーク パフォーマンスを最大限に引き出します。

ネットワーク·インタフェース

シングルポート800GbE OSFP112またはデュアルポートをサポート 400GbE QSFP112 柔軟な構成。

200GbE/100GbE の速度との下位互換性があり、既存のインフラストラクチャに適応します。

オンチップアクセラレーションエンジン

フロー テーブル管理、輻輳制御 (DCQCN)、パケット検証、およびその他の完全なハードウェア オフロードをサポートする専用の ASIC を統合します。

400G QSFP112

ネットワークアーキテクチャと接続

ConnectX-8 SuperNICは、マルチレイヤーCLOSアーキテクチャネットワークをサポートし、高帯域幅のノンブロッキングAIコンピューティングクラスターを構築します。

単一ノード接続

各サーバーは 1 ~ 2 個の ConnectX-8 NIC を導入し、PCIe 5.0 を介してホストと相互接続します。

各ポートは QSFP-DD 光ファイバーを介してリーフ スイッチに直接接続され、デュアル アップリンク冗長性を形成します。

クラスターネットワーキング

  1. リーフ スイッチ: NVIDIA Quantum-3 シリーズ (800G) または Spectrum-4 シリーズ (400G)、RoCEv2 およびアダプティブ ルーティングをサポートします。
  2. スパイン スイッチ: 800G 高速ポートを介してリーフ スイッチと完全に相互接続され、ノンブロッキング帯域幅を提供します。
  3. スパインリーフアーキテクチャ
  4. GPU ダイレクト ネットワーキング: マルチノード GPU は、RDMA を介してノード間のメモリ直接アクセスを実現し、分散トレーニング クラスターを形成します。
ネットワークアーキテクチャと接続

光モジュールとファイバーの選択

光モジュール

800G シナリオ: OSFP112 800G-SR8/VR8 (マルチモード、100m) / 800G-DR8 (シングルモード、500m)。

OSFP-800G-DR8D

400G シナリオ: QSFP112 400G-VR4/SR4/DR4。

繊維タイプ:

QSFP112 400G SR4

マルチモード (MMF): OM5/OM4 (850nm、最大 400m の 8G-SR100 をサポート)。

シングルモード (SMF): OS2 (1310nm/1550nm、10km を超える長距離伝送をサポート)。

繊維の種類
製品仕様

互換性のあるスイッチとエコシステムのコラボレーション

NVIDIA スイッチ:

クォンタム3: 800G インフィニバンド SHARPv3集約通信アクセラレーションをサポートするスイッチ。

Spectrum-4: RoCEv400 とインテリジェントなトラフィック スケジューリングをサポートする 2G イーサネット スイッチ。

サードパーティ製スイッチ:

Arista 7800R3 (800G)、Cisco Nexus 92300YC (400G): RoCEv2 および ECMP ロード バランシングのサポートを確保します。

互換性のあるスイッチとエコシステムのコラボレーション

コメント

上へスクロール