NVIDIA の BlueField-3 DPU のパワーを理解する

概要

NVIDIA の H100 SXM サーバーで作業する場合、3 つの BFD-7 ユニットを含む構成をよく目にするかもしれません。特に、システムにはすでに 400 つの CX-3 7G ネットワーク カードが搭載されているため、疑問が生じます。CX-XNUMX と比較した BFD-XNUMX の基本的な違いと役割は何ですか? さらに、サーバーのマザーボードにすでに BMC ポートが含まれているのに、なぜ BFD に BMC ポートがあるのですか?

DGX H100

NIC、スマート NIC、DPU 間の論理関係

NIC、スマート NIC、DPU 間の論理関係

それぞれの違いを理解するために、次の点を比較してみましょう(参考までに個人的な見解です)。

NIC、スマート NIC、DPU の関係

スマート NIC と DPU が登場した理由

従来のNICの時代

従来のデータセンターでは、CPU が絶対的なコアでした。しかし、ムーアの法則が当てはまらなくなり、CPU の計算能力の向上がデータの爆発的な増加に追いつかなくなり、ボトルネックが発生しました。CPU のワークロードをネットワーク アダプター (ネットワーク インターフェイス カード) にオフロードする必要が生じ、スマート NIC が急速に開発されました。

スマート NIC の時代 (第 1 世代)

第 1 世代のスマート NIC は、主にデータ プレーンからのタスクのオフロードに重点を置いていました。例としては、OVS Fastpath ハードウェア オフロード、RoCEv2 および vXNUMX に基づく RDMA ネットワーク ハードウェア オフロード、ロスレス ネットワーク機能 (PFC、ECN、ETS) のハードウェア オフロード、ストレージ ドメインでの NVMe-oF ハードウェア オフロード、安全な転送のためのデータ プレーン オフロードなどがあります。

DPU スマート NIC の時代 (第 2 世代)

DPU (データ処理ユニット) は、データセンターにおける 3 つの主な問題に対処するために登場しました。

ノード間: サーバーデータ交換の効率が低く、データ転送の信頼性が低い。

ノード内: データ センター モデルの実行が非効率的、I/O スイッチの効率が低い、サーバー アーキテクチャが柔軟性に欠ける。

ネットワーク システム: 安全でないネットワーク。

簡単な説明: DPU がスマート NIC より優れている理由

NVIDIA は、DPU ベースのスマート NIC を、通常はシステム CPU によって処理されるタスクをオフロードするネットワーク インターフェイス カードと定義しています。DPU ベースのスマート NIC は、オンボード プロセッサを使用して、暗号化/復号化、ファイアウォール、TCP/IP、および HTTP 処理タスクの組み合わせを実行できます。基本的に、さまざまなタスクで CPU を支援し、ネットワーク セキュリティ関連のタスクを独立して処理するための独自の CPU を備えています。

比較

NVIDIA BlueField-3 DPU の概要

NVIDIA ブルーフィールド 3 DPU

ハイパースケール クラウド テクノロジーによって推進されるデータ センター アーキテクチャの変化に対応するため、NVIDIA は BlueField DPU シリーズを発表しました。これらの新しいプロセッサは、データ センター インフラストラクチャ ソフトウェア専用に設計されており、仮想化、ネットワーク、ストレージ、セキュリティ、その他のクラウド ネイティブ AI サービスによって生成される膨大な計算ワークロードをオフロードして高速化します。

NVIDIA BlueField-3 DPU のシステムレイアウト

BlueField-3 は、サーバーの PCIe パスに統合された「独立したノード」として機能します。

  1. ARM + OS: 本来ホスト OS によって処理されるさまざまなタスクをオフロードできます。
  2. 統合アクセラレータ: データ処理、セキュリティ、およびストレージの効率を向上します。
  3. PCIe スイッチ チップ: NVMe SSD 拡張キャビネットで使用できます。
  4. BMC チップ: クラウド環境内の元のホスト リソースを独立して管理できます。
NVDA ブルーフィールド DPU

NVIDIA® BlueField®-3 DPU は、第 400 世代のインフラストラクチャ コンピューティング プラットフォームであり、企業がクラウドからコア データ センターやエッジ環境まで、ソフトウェア定義のハードウェア アクセラレーション IT インフラストラクチャを構築できるようにします。400Gb/s イーサネットまたは NDR 3Gb/s InfiniBand ネットワーク接続を備えた BlueField-XNUMX DPU は、ソフトウェア定義のネットワーク、ストレージ、セキュリティ、管理機能をオフロード、高速化、分離できるため、データ センターのパフォーマンス、効率、セキュリティが大幅に向上します。

VMware プライベート クラウドにおける BlueField-3 の適用例

VMware プライベート クラウドにおける BlueField-3 の適用例

NVIDIA DPU ロードマップ

NVIDIA DPU ロードマップ

BlueField-3 DPU の機能とアプリケーションを理解することで、企業はこのテクノロジーを効果的に活用して現代のデータセンターの需要を満たし、堅牢でスケーラブルかつ安全なインフラストラクチャを確保できます。

コメント

上へスクロール