液体冷却は Blackwell にとって十分に効率的ですか?

AI 技術が進歩し続けるにつれて、より多くのデータセンターが液体冷却に目を向けています。従来の空冷方式と比較して、液体冷却、特に Direct Liquid Cooling (DLC) は、放熱効率が大幅に向上します。液体の熱伝導率は空気の 50 ~ 3,000 倍であるため、大量の熱を発生する高密度サーバー環境でより優れた熱管理が可能になります。さらに、液体冷却は全体的なエネルギー消費を削減できます。調査によると、空気システムから液体システムに移行すると、施設の電力使用量が 27%、サイト全体のエネルギー消費量が 15.5% 削減される可能性があります。液体冷却のもう XNUMX つの利点は、動作音が静かで、物理的な設置面積が小さいことです。

要約すると、液体冷却は、高いエネルギー効率、静かな動作、省スペースの利点を誇ります。

CoolIT Systems 液体冷却ソリューション

2001 年に設立された CoolIT Systems (CoolIT) は、当初はデスクトップ ゲーム業界向けの直接液体冷却製品の設計と販売を行っていました。2014 年に同社はデータ センターとサーバー OEM 向けの製品の開発を開始し、現在では直接液体冷却ソリューションの大手プロバイダーとして認められています。カナダのカルガリーに本社を置く CoolIT は、カナダと中国の両方に製造施設を持っています。特に CoolIT は、世界最速のスーパーコンピューターとされる El Capitan に液体冷却サポートを提供しています。

CoolITはEl Capitanに液体冷却サポートを提供

最近、Blackwell の過熱に関する報告が相次ぐ中、CoolIT Systems は世界最高密度の液体対液体冷却分配ユニット (CDU) である CHx1000 の発売を発表しました。ミッションクリティカルなアプリケーション向けに特別に設計された CHx1000 は、NVIDIA Blackwell プラットフォームや、液体冷却を必要とするその他の要求の厳しい AI ワークロードを冷却することを目的としています。

CoolITシステム

CoolIT の COO である Patrick McGinn 氏によると、CHx1000 は 20 年以上にわたる DLC のイノベーションと大手プロセッサ メーカーおよびハイパースケール企業とのコラボレーションを活用し、アプローチ温度 1000°C で最大 1.5 リットル/分/キロワット (LPM/kW) の流量で 3kW の冷却能力を実現します。

CHx1000 液対液 CDU は、まず前例のない 200 台の NVIDIA GB72 NVL200 プラットフォーム ラックを冷却し、将来の AI チップや高熱密度サーバーに十分なパフォーマンスを提供します。NVIDIA GB72 NVL30 は、前モデルよりも 25 倍高速な推論パフォーマンスと XNUMX 倍のエネルギー効率を提供し、大規模な LLM アプリケーションに適しています。

CHx1000 は、インロー メンテナンス用に設計されており、前面と背面からアクセスでき、動作を中断することなく現場で交換可能なポンプ、フィルター、センサーを備えています。信頼性の高い設計には、ステンレス鋼の配管、内蔵の 25 ミクロン フィルター、最高級の濡れた材料が含まれています。インテリジェントな制御により、チップの正確な温度、流量、圧力に合わせて冷却剤の流量が動的に調整されます。デバイスは、10 インチのタッチスクリーンまたは Redfish、SNMP、TCP/IP、Modbus などのプロトコルを介してリモート制御できます。

CHx1000

Supermicro 直接液体冷却

Supermicro は、NVIDIA Blackwell GPU を液冷ラック構成に統合した SuperCluster ソリューションを発表しました。このセットアップにより、GPU コンピューティング密度が向上し、垂直冷却剤分配マニホールドや改良されたコールド プレートなどの高度な機能により、最適な熱管理が可能になります。この設計により効率が向上し、運用コストが削減されるため、大規模な AI 導入に適しています。

今年の Computex で、SuperMicro は、HGX B10 ベースのシステム向けの 4U 空冷式および 200U 液冷式デバイスを含む、Nvidia の Blackwell GPU 向けに最適化されたシステムを発表しました。同社はまた、空冷式の HGX B100 システムと、Nvidia NVLink スイッチで相互接続された 200 個の GPU を搭載した GB72 NVL72 ラックも開発中です。さらに、SuperMicro は Intel の Xeon 6 ベースのシステムの発売を約束しています。

スーパーマイクロはインテルのXeon 6をベースにしたシステムを発売することを約束した。

Super-micro の液冷ラック ソリューションは、次のような内部設計のコンポーネントで構成されています。

  1. 冷却剤分配ユニット (CDU): このユニットには、CPU と GPU を冷却するコールド プレートに冷却剤を循環させるポンプ システムが含まれています。Supermicro の CDU は、ホットスワップ可能な冗長ポンプ モジュールと電源モジュールを 100 つ統合し、ほぼ 100% の稼働率を保証します。最大 XNUMXkW の冷却能力があり、非常に高いラック密度を実現します。CDU には、ラック操作の監視と制御のために WebUI からアクセスできる使いやすいタッチスクリーンも搭載されており、Supermicro の Super Cloud Composer データセンター管理ソフトウェアに統合されています。制御システムは、すべての CPU と GPU の効率的な冷却を確保しながら電力消費を最適化し、効果的な結露防止戦略によりハードウェアのパフォーマンス低下を防ぎます。
  2. 冷却剤分配マニホールド (CDM): CDM は各サーバーに冷却剤を供給し、加熱された冷却剤を CDU に戻します。CDM には次の 2 種類があります。
  3. 垂直: ラックの背面に設置されたこれらのマニホールドは、ホースを介して CDU に直接接続されます。ラックの背面にある入口ホースと出口ホースを使用して、システムのコールド プレートに冷却剤を送ります。
  4. 水平: ラックの前面の 1U ラック スペース内に配置されたこれらのマニホールドは、背面の垂直マニホールドをラック前面のシステム (SuperBlades や 8U GPU サーバーなど) のコールド プレートに接続します。
  5. コールド プレート: コールド プレートは CPU と GPU の上に配置され、冷却剤がマイクロチャネルを流れてチップを効率的に冷却します。Supermicro のコールド プレートは、チップ上のホットスポットを最小限に抑え、超低熱抵抗を実現するように設計されています。
ラック

Lenovo Neptune 液体冷却システム

Lenovo ThinkSystem N1380 Neptune は、高密度サーバー ラックを効率的に冷却するように設計された第 100 世代の垂直液体冷却システムで、特殊な空調を必要とせずに 40 kW を超える構成を実現します。このオープン ループ直接温水冷却システムは、従来の冷却方法よりも XNUMX% 低い電力消費量を大幅に削減します。Lenovo の液体冷却に関する専門知識は、IBM のサーバー技術の買収によって培われ、この分野のリーダーとしての地位を確立しました。

直接水冷ソリューションは、温水を再循環させてデータセンター システムを冷却し、すべてのサーバー コンポーネントを冷却状態に保ち、電力を大量に消費するシステム ファンの必要性を減らします。CPU とアクセラレータ向けに最適化された特許取得済みのコールド プレート設計により、アクセラレータの冷却能力が最大化され、現在は約 700W の電力消費に対応していますが、将来の設計では 1000W を超えることが予想されています。新しい温水冷却設計 (Neptune™ 温水冷却) により、データセンターの特別な空調なしで運用が可能になります。

Lenovo Neptune 液体冷却システム

コメント

上へスクロール