بطاقة NVIDIA HGX B200 وأفكار حول حل التبريد السائل الخاص بها

إن NVIDIA HGX B200 هي أحدث منصة حوسبة عالية الأداء من NVIDIA، والتي تعتمد على بنية وحدة معالجة الرسوميات Blackwell. وهي تدمج العديد من التقنيات والمكونات المتقدمة المصممة لتقديم أداء حوسبة استثنائي وكفاءة في استخدام الطاقة.

HGX B200 تبريد الهواء

يصل ارتفاع النظام الكامل مع وحدة التبريد بالهواء HGX B200 إلى 10U، حيث تمثل وحدة التبريد بالهواء HGX B200 نفسها ما يقرب من 6U.

خادم Exxact TensorEX 10U HGX B200

خادم Exxact TensorEX 10U HGX B200

6 × 5250 واط مصادر طاقة احتياطية (3 + 3)

خادم فائق

SuperServer SYS-A22GA-NBRT(10U)6x 5250W مصادر طاقة احتياطية (3 + 3)

في مؤتمر OCP Global Summit 2024، تم عرض العديد من الصور الجديدة لبطاقة NVIDIA HGX B200. وبالمقارنة مع NVIDIA HGX A100/H100/H200، فإن التغيير الكبير هو نقل شريحة NVLink Switch إلى مركز المكون، بدلاً من جانب واحد. يقلل هذا التغيير من أقصى مسافة ارتباط بين وحدات معالجة الرسومات وشريحة NVLink Switch. تتكون NVLink Switch الآن من شريحتين فقط، مقارنة بأربع شرائح في الجيل السابق، وقد زاد حجمها بشكل ملحوظ.

بالقرب من موصلات الحافة، تم استبدال NVSwitch بمؤقت PCIe Retimer. تستخدم هذه الموقتات عادةً مشتتات حرارية أصغر حجمًا حيث يبلغ TDP (طاقة التصميم الحراري) الخاصة بها حوالي 10-15 وات.

لوحة رئيسية HGX B200 بدون مشتت حراري

اللوحة الأم HGX B200 بدون مشتتات حرارية – 1

لوحة رئيسية HGX B200 بدون مشتت حراري-2

اللوحة الأم HGX B200 بدون مشتتات حرارية – 2

الموقت

شريحة إعادة ضبط الوقت للوحة الأم HGX B200 ومبدد الحرارة

تشير الشاشة الحريرية على السطح العلوي لموصل EXAMAX إلى أن هذه هي اللوحة الأساسية لوحدة معالجة الرسوميات Umbriel GB200 SXM6 8، برقم القطعة: 675-26287-00A0-TS53. يكشف الفحص الدقيق أن الشركة المصنعة لشريحة Retimer هي Astera Labs.

رقم القطعة B200

معلومات حول رقم قطعة NVIDIA HGX B200

شريحة NVIDIA HGX B200 Astera Labs Retimer عن قرب

شريحة NVIDIA HGX B200 Astera Labs Retimer عن قرب

يتم تغليف محيط اللوحة الأم HGX B200 بإطار تثبيت مصنوع من سبيكة الألومنيوم السوداء يستخدم لتأمين المبددات الحرارية وربط المواد الحرارية.

إطار تثبيت مشتت الحرارة للوحة الأم NVIDIA HGX B200

إطار تثبيت مشتت الحرارة للوحة الأم NVIDIA HGX B200

فيما يلي صور لشريحة NVLink Switch المعروضة في قمة OCP العالمية لعام 2024.

شريحة تبديل NVLink من NVIDIA HGX B200 عن قرب

اعتبارات خاصة بحل التبريد السائل لـ HGX B200

لقد حددت NVIDIA قيمتين لـ TDP (طاقة التصميم الحراري) لـ B200: 1200 وات للتبريد السائل و1000 وات للتبريد الهوائي. بالإضافة إلى ذلك، تقدم B100 نطاق 700 وات مشابهًا لـ H100 SXM السابقة، مما يسمح لمصنعي المعدات الأصلية بإعادة استخدام تصميم التبريد الهوائي 700 وات. ترتبط حدود TDP الأعلى بزيادة ترددات الساعة وعدد وحدات الحساب الممكنة، وبالتالي تحسين الأداء. في الواقع، يبلغ أداء FP4 (Tensor Core) لـ B200/1200W 20 PFLOPS، وB200/1000W 18 PFLOPS، وB100/700W 14 PFLOPS.

يستخدم نظام OAI حلقة صفيحة باردة (أي أنبوب مياه) مقاس 4×2، حيث يتدفق السائل البارد في البداية إلى الصفيحات الباردة على OAM 1-4، ويمتص الحرارة ثم يسخن قليلاً قبل المرور عبر الصفيحات الباردة على OAM 5-8. وهذا يشبه التبريد بالهواء، حيث يمر تدفق الهواء بشكل متسلسل عبر مشتتات الحرارة لوحدتي معالجة مركزية.

على النقيض من ذلك، يقوم تصميم حلقة اللوحة الباردة 8×1 بتوزيع السائل البارد بالتساوي على جميع OAMs الثمانية، مما يتجنب درجات الحرارة الأعلى في نصف OAMs ولكنه قد يتسبب في تكاليف أعلى بسبب الأنابيب الإضافية.

أوم 1.5

في مواصفات OAM 1.5، يتم توضيح تجميع اللوحة الباردة في ترتيب 4-متوازي-2-سلسلة.

4-متوازي-2-سلسلة

تكوين 4 متوازيين و2 سلسلة مقابل تكوين 8×1

اللوحة الباردة لبطاقة nvidia h100
وحدة H3C R5500 G6 H100

وحدة تبريد سائل H3C R5500 G6 H100 4-parallel-3-series (2 GPUs في التوازي + 1 Switch في التسلسل)

H100 8+4 (تكوين 4 سلاسل متوازية و3 سلاسل)

بناءً على تكوينات اللوحة الباردة H100 المذكورة أعلاه، فإن الاعتبارات الخاصة بحل التبريد السائل B200 هي كما يلي: يتم تقسيم وحدات معالجة الرسوميات الثماني والمفتاحين إلى مجموعتين. تتكون كل مجموعة من 8 وحدات معالجة رسوميات ومفتاح واحد. تستخدم كلتا المجموعتين نفس مخطط التبريد السائل. تحتوي كل مجموعة على منفذي مدخل ومنفذي مخرج للألواح الباردة. تكون وحدتا معالجة الرسوميات العلويتان متوازيتين ومتصلتين على التوالي بالمفتاح، وتكون وحدتا معالجة الرسوميات السفليتان أيضًا متوازيتين ومتصلتين على التوالي بنفس المفتاح، مما ينتج عنه 2 منافذ مدخل/مخرج على اللوحة الباردة للمفتاح.

بدلاً من ذلك، يمكن تصميم المجمع بستة مداخل وستة مخارج، حيث يتم استخدام أربعة من المداخل والمخارج لوحدات معالجة الرسوميات الثماني (تكوين 6 متوازية من سلسلتين)، والمدخلان والمخرجان الآخران مخصصان للمفتاحين، كل منهما متصل بالمجمع. يتطلب هذا النهج دراسة متأنية لمسار التوجيه والقيود المكانية للأنابيب. ومع ذلك، بغض النظر عن الحل المختار، فإن تقييم المحاكاة التفصيلي والتصميم العملي للنظام ضروريان.

اترك تعليق

انتقل إلى الأعلى