NVIDIA HGX B200 は、Blackwell GPU アーキテクチャに基づく NVIDIA の最新の高性能コンピューティング プラットフォームです。優れたコンピューティング パフォーマンスとエネルギー効率を実現するように設計された複数の高度なテクノロジとコンポーネントを統合しています。

HGX B200 空冷モジュールを搭載したシステム全体の高さは 10U に達し、HGX B200 空冷モジュール自体は約 6U を占めます。

Exxact TensorEX 10U HGX B200 サーバー
6x 5250W 冗長 (3 + 3) 電源

SuperServer SYS-A22GA-NBRT(10U)6x 5250W 冗長(3 + 3)電源
OCP Global Summit 2024 では、NVIDIA HGX B200 の新しい写真がいくつか公開されました。NVIDIA HGX A100/H100/H200 と比較すると、NVLink スイッチ チップがコンポーネントの片側ではなく中央に再配置されたことが大きな変更点です。この変更により、GPU と NVLink スイッチ チップ間の最大リンク距離が最小限に抑えられます。NVLink スイッチは、前世代の XNUMX つのチップから XNUMX つのチップのみで構成され、サイズが大幅に増加しました。
エッジ コネクタの近くでは、NVSwitch の代わりに PCIe リタイマーが使用されています。これらのリタイマーは、TDP (熱設計電力) が約 10 ~ 15W であるため、通常、より小型のヒートシンクを使用します。

HGX B200 マザーボード(ヒートシンクなし) – 1

HGX B200 マザーボード(ヒートシンクなし) – 2

HGX B200 マザーボード リタイマー チップ ヒートシンク
EXAMAX コネクタの上面のシルクスクリーンには、これが Umbriel GB200 SXM6 8 GPU ベースボードであり、部品番号が 675-26287-00A0-TS53 であることが示されています。詳しく調べると、Retimer チップの製造元は Astera Labs であることがわかります。

NVIDIA HGX B200 部品番号情報

NVIDIA HGX B200 Astera Labs リタイマー チップのクローズアップ
HGX B200 マザーボードの周囲は、ヒートシンクを固定し、熱伝導材を取り付けるために使用される黒色のアルミニウム合金の取り付けフレームで覆われています。

NVIDIA HGX B200 マザーボード ヒートシンク マウント フレーム
以下は、2024 OCP Global Summit で展示された NVLink スイッチ チップの画像です。

HGX B200 の液体冷却ソリューションに関する考慮事項
NVIDIA は、B200 の TDP (熱設計電力) 値を 1200 つ設定しました。液体冷却の場合は 1000W、空冷の場合は 100W です。さらに、B700 は以前の H100 SXM と同様に 700W の範囲を提供しているため、OEM メーカーは 4W 空冷設計を再利用することができます。TDP 制限が高くなると、クロック周波数と有効な演算ユニットの数が増加し、パフォーマンスが向上します。実際、FP200 (Tensor Core) のパフォーマンスは、B1200/20W では 200 PFLOPS、B1000/18W では 100 PFLOPS、B700/14W では XNUMX PFLOPS です。
OAI システムは 4×2 のコールド プレート (つまり水道管) ループを採用しており、冷たい液体が最初に OAM 1-4 上のコールド プレートに流れ込み、熱を吸収して少し温まってから OAM 5-8 上のコールド プレートを通過します。これは、空気の流れが XNUMX つの CPU のヒートシンクを順番に通過する空冷に似ています。
対照的に、8×1 コールド プレート ループ レイアウトでは、冷たい液体が 8 つの OAM すべてに均等に分配され、OAM の半分で高温になることは回避されますが、追加の配管によりコストが高くなる可能性があります。

OAM 1.5 仕様では、コールド プレート アセンブリは 4 並列 2 直列の配置で示されています。

4並列2直列と8×1構成


H3C R5500 G6 H100 モジュール 液体冷却 4 並列 3 直列 (並列 GPU 2 個 + 直列スイッチ 1 個)

上記の H100 コールド プレート構成に基づいて、B200 液体冷却ソリューションの考慮事項は次のとおりです。8 つの GPU と 2 つのスイッチが 2 つのグループに分けられます。各グループは 4 つの GPU と 1 つのスイッチで構成されます。両方のグループで同じ液体冷却方式が使用されます。各グループには、コールド プレート用の入口ポートと出口ポートが 2 つずつあります。上部の 2 つの GPU は並列でスイッチと直列に接続され、下部の 2 つの GPU も同じスイッチと並列で直列に接続されているため、スイッチ コールド プレートには 2 つの入口/出口ポートがあります。
あるいは、マニホールドを 6 つの入口と 6 つの出口で設計し、そのうち 4 つの入口と出口を 8 つの GPU (4 並列 2 直列構成) に使用し、残りの 2 つの入口と 2 つの出口を 2 つのスイッチ (それぞれマニホールドに接続) に使用します。このアプローチでは、配管のルーティング パスとスペースの制約を慎重に考慮する必要があります。ただし、選択したソリューションに関係なく、詳細なシミュレーション評価と実用的なシステム設計が必要です。
関連製品:
-
OSFP-800G-FR4 800G OSFP FR4 (回線あたり 200G) PAM4 CWDM デュプレックス LC 2km SMF 光トランシーバー モジュール $5000.00
-
OSFP-800G-2FR2L 800G OSFP 2FR2 (回線あたり 200G) PAM4 1291/1311nm 2km DOM デュプレックス LC SMF 光トランシーバ モジュール $4500.00
-
OSFP-800G-2FR2 800G OSFP 2FR2 (回線あたり 200G) PAM4 1291/1311nm 2km DOM デュアル CS SMF 光トランシーバ モジュール $4500.00
-
OSFP-800G-DR4 800G OSFP DR4 (回線あたり 200G) PAM4 1311nm MPO-12 500m SMF DDM 光トランシーバー モジュール $3500.00
-
NVIDIA MMS4X00-NM-FLT 互換 800G ツインポート OSFP 2x400G フラットトップ PAM4 1310nm 500m DOM デュアル MTP/MPO-12 SMF 光トランシーバー モジュール $1200.00
-
NVIDIA MMA4Z00-NS-FLT 互換 800Gb/s ツインポート OSFP 2x400G SR8 PAM4 850nm 100m DOM デュアル MPO-12 MMF 光トランシーバー モジュール $850.00
-
NVIDIA MMS4X00-NM 互換 800Gb/s ツインポート OSFP 2x400G PAM4 1310nm 500m DOM デュアル MTP/MPO-12 SMF 光トランシーバー モジュール $1100.00
-
NVIDIA MMA4Z00-NS 互換 800Gb/s ツインポート OSFP 2x400G SR8 PAM4 850nm 100m DOM デュアル MPO-12 MMF 光トランシーバー モジュール $750.00
-
NVIDIA MMS1Z00-NS400 互換 400G NDR QSFP112 DR4 PAM4 1310nm 500m MPO-12 FEC 光トランシーバー モジュール付き $800.00
-
NVIDIA MMS4X00-NS400 互換 400G OSFP DR4 フラットトップ PAM4 1310nm MTP/MPO-12 500m SMF FEC 光トランシーバー モジュール $800.00
-
NVIDIA MMA1Z00-NS400 互換 400G QSFP112 SR4 PAM4 850nm 100m MTP/MPO-12 OM3 FEC 光トランシーバー モジュール $650.00
-
NVIDIA MMA4Z00-NS400 互換 400G OSFP SR4 フラットトップ PAM4 850nm OM30 で 3m/OM50 で 4m MTP/MPO-12 マルチモード FEC 光トランシーバ モジュール $650.00
-
NVIDIA MMS4X50-NM 互換 OSFP 2x400G FR4 PAM4 1310nm 2km DOM デュアルデュプレックス LC SMF 光トランシーバー モジュール $1350.00
-
OSFP-XD-1.6T-4FR2 1.6T OSFP-XD 4xFR2 PAM4 1291/1311nm 2km SN SMF 光トランシーバ モジュール $17000.00
-
OSFP-XD-1.6T-2FR4 1.6T OSFP-XD 2xFR4 PAM4 2x CWDM4 2km デュアルデュプレックス LC SMF 光トランシーバーモジュール $22400.00
-
OSFP-XD-1.6T-DR8 1.6T OSFP-XD DR8 PAM4 1311nm 2km MPO-16 SMF 光トランシーバー モジュール $12600.00