إن NVIDIA HGX B200 هي أحدث منصة حوسبة عالية الأداء من NVIDIA، والتي تعتمد على بنية وحدة معالجة الرسوميات Blackwell. وهي تدمج العديد من التقنيات والمكونات المتقدمة المصممة لتقديم أداء حوسبة استثنائي وكفاءة في استخدام الطاقة.

يصل ارتفاع النظام الكامل مع وحدة التبريد بالهواء HGX B200 إلى 10U، حيث تمثل وحدة التبريد بالهواء HGX B200 نفسها ما يقرب من 6U.

خادم Exxact TensorEX 10U HGX B200
6 × 5250 واط مصادر طاقة احتياطية (3 + 3)

SuperServer SYS-A22GA-NBRT(10U)6x 5250W مصادر طاقة احتياطية (3 + 3)
في مؤتمر OCP Global Summit 2024، تم عرض العديد من الصور الجديدة لبطاقة NVIDIA HGX B200. وبالمقارنة مع NVIDIA HGX A100/H100/H200، فإن التغيير الكبير هو نقل شريحة NVLink Switch إلى مركز المكون، بدلاً من جانب واحد. يقلل هذا التغيير من أقصى مسافة ارتباط بين وحدات معالجة الرسومات وشريحة NVLink Switch. تتكون NVLink Switch الآن من شريحتين فقط، مقارنة بأربع شرائح في الجيل السابق، وقد زاد حجمها بشكل ملحوظ.
بالقرب من موصلات الحافة، تم استبدال NVSwitch بمؤقت PCIe Retimer. تستخدم هذه الموقتات عادةً مشتتات حرارية أصغر حجمًا حيث يبلغ TDP (طاقة التصميم الحراري) الخاصة بها حوالي 10-15 وات.

اللوحة الأم HGX B200 بدون مشتتات حرارية – 1

اللوحة الأم HGX B200 بدون مشتتات حرارية – 2

شريحة إعادة ضبط الوقت للوحة الأم HGX B200 ومبدد الحرارة
تشير الشاشة الحريرية على السطح العلوي لموصل EXAMAX إلى أن هذه هي اللوحة الأساسية لوحدة معالجة الرسوميات Umbriel GB200 SXM6 8، برقم القطعة: 675-26287-00A0-TS53. يكشف الفحص الدقيق أن الشركة المصنعة لشريحة Retimer هي Astera Labs.

معلومات حول رقم قطعة NVIDIA HGX B200

شريحة NVIDIA HGX B200 Astera Labs Retimer عن قرب
يتم تغليف محيط اللوحة الأم HGX B200 بإطار تثبيت مصنوع من سبيكة الألومنيوم السوداء يستخدم لتأمين المبددات الحرارية وربط المواد الحرارية.

إطار تثبيت مشتت الحرارة للوحة الأم NVIDIA HGX B200
فيما يلي صور لشريحة NVLink Switch المعروضة في قمة OCP العالمية لعام 2024.

اعتبارات خاصة بحل التبريد السائل لـ HGX B200
لقد حددت NVIDIA قيمتين لـ TDP (طاقة التصميم الحراري) لـ B200: 1200 وات للتبريد السائل و1000 وات للتبريد الهوائي. بالإضافة إلى ذلك، تقدم B100 نطاق 700 وات مشابهًا لـ H100 SXM السابقة، مما يسمح لمصنعي المعدات الأصلية بإعادة استخدام تصميم التبريد الهوائي 700 وات. ترتبط حدود TDP الأعلى بزيادة ترددات الساعة وعدد وحدات الحساب الممكنة، وبالتالي تحسين الأداء. في الواقع، يبلغ أداء FP4 (Tensor Core) لـ B200/1200W 20 PFLOPS، وB200/1000W 18 PFLOPS، وB100/700W 14 PFLOPS.
يستخدم نظام OAI حلقة صفيحة باردة (أي أنبوب مياه) مقاس 4×2، حيث يتدفق السائل البارد في البداية إلى الصفيحات الباردة على OAM 1-4، ويمتص الحرارة ثم يسخن قليلاً قبل المرور عبر الصفيحات الباردة على OAM 5-8. وهذا يشبه التبريد بالهواء، حيث يمر تدفق الهواء بشكل متسلسل عبر مشتتات الحرارة لوحدتي معالجة مركزية.
على النقيض من ذلك، يقوم تصميم حلقة اللوحة الباردة 8×1 بتوزيع السائل البارد بالتساوي على جميع OAMs الثمانية، مما يتجنب درجات الحرارة الأعلى في نصف OAMs ولكنه قد يتسبب في تكاليف أعلى بسبب الأنابيب الإضافية.

في مواصفات OAM 1.5، يتم توضيح تجميع اللوحة الباردة في ترتيب 4-متوازي-2-سلسلة.

تكوين 4 متوازيين و2 سلسلة مقابل تكوين 8×1


وحدة تبريد سائل H3C R5500 G6 H100 4-parallel-3-series (2 GPUs في التوازي + 1 Switch في التسلسل)

بناءً على تكوينات اللوحة الباردة H100 المذكورة أعلاه، فإن الاعتبارات الخاصة بحل التبريد السائل B200 هي كما يلي: يتم تقسيم وحدات معالجة الرسوميات الثماني والمفتاحين إلى مجموعتين. تتكون كل مجموعة من 8 وحدات معالجة رسوميات ومفتاح واحد. تستخدم كلتا المجموعتين نفس مخطط التبريد السائل. تحتوي كل مجموعة على منفذي مدخل ومنفذي مخرج للألواح الباردة. تكون وحدتا معالجة الرسوميات العلويتان متوازيتين ومتصلتين على التوالي بالمفتاح، وتكون وحدتا معالجة الرسوميات السفليتان أيضًا متوازيتين ومتصلتين على التوالي بنفس المفتاح، مما ينتج عنه 2 منافذ مدخل/مخرج على اللوحة الباردة للمفتاح.
بدلاً من ذلك، يمكن تصميم المجمع بستة مداخل وستة مخارج، حيث يتم استخدام أربعة من المداخل والمخارج لوحدات معالجة الرسوميات الثماني (تكوين 6 متوازية من سلسلتين)، والمدخلان والمخرجان الآخران مخصصان للمفتاحين، كل منهما متصل بالمجمع. يتطلب هذا النهج دراسة متأنية لمسار التوجيه والقيود المكانية للأنابيب. ومع ذلك، بغض النظر عن الحل المختار، فإن تقييم المحاكاة التفصيلي والتصميم العملي للنظام ضروريان.
المنتجات ذات الصلة:
-
OSFP-800G-FR4 800G OSFP FR4 (200 جيجا لكل خط) PAM4 CWDM دوبلكس LC 2km SMF وحدة الإرسال والاستقبال الضوئية $3500.00
-
OSFP-800G-2FR2L 800G OSFP 2FR2 (200 جيجا لكل خط) PAM4 1291/1311nm 2km DOM دوبلكس LC SMF وحدة الإرسال والاستقبال الضوئية $3000.00
-
OSFP-800G-2FR2 800G OSFP 2FR2 (200 جيجا لكل خط) PAM4 1291/1311nm 2km DOM Dual CS SMF وحدة الإرسال والاستقبال الضوئية $3000.00
-
OSFP-800G-DR4 800G OSFP DR4 (200 جيجا لكل خط) PAM4 1311nm MPO-12 500m SMF DDM وحدة الإرسال والاستقبال الضوئية $3000.00
-
NVIDIA MMS4X00-NM-FLT متوافق مع 800G Twin-port OSFP 2x400G Flat Top PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $1199.00
-
NVIDIA MMA4Z00-NS-FLT متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال البصرية $650.00
-
NVIDIA MMS4X00-NM متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $900.00
-
NVIDIA MMA4Z00-NS متوافق مع 800Gb / s ثنائي المنافذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال الضوئية $650.00
-
NVIDIA MMS1Z00-NS400 متوافق 400G NDR QSFP112 DR4 PAM4 1310nm 500m MPO-12 مع وحدة الإرسال والاستقبال الضوئية FEC $700.00
-
NVIDIA MMS4X00-NS400 متوافق 400G OSFP DR4 Flat Top PAM4 1310nm MTP / MPO-12m SMF FEC وحدة الإرسال والاستقبال البصرية $700.00
-
وحدة إرسال واستقبال بصرية متوافقة مع NVIDIA MMA1Z00-NS400، 400 جيجابايت، QSFP112 VR4 PAM4، 850 نانومتر، 50 مترًا، MTP/MPO-12 OM4 FEC $550.00
-
NVIDIA MMA4Z00-NS400 متوافق مع 400G OSFP SR4 مسطح علوي PAM4 850 نانومتر 30 متر على OM3 / 50m على وحدة الإرسال والاستقبال البصرية OM4 MTP / MPO-12 Multimode FEC $550.00
-
NVIDIA MMS4X50-NM متوافق مع OSFP 2x400G FR4 PAM4 1310nm 2km DOM وحدة الإرسال والاستقبال الضوئية المزدوجة LC SMF $1200.00
-
OSFP-XD-1.6T-4FR2 1.6T OSFP-XD 4xFR2 PAM4 1291/1311nm 2km SN SMF وحدة الإرسال والاستقبال الضوئية $15000.00
-
وحدة إرسال واستقبال بصرية OSFP-XD-1.6T-2FR4 1.6T OSFP-XD 2xFR4 PAM4 2x CWDM4 2km Dual Duplex LC SMF $20000.00
-
OSFP-XD-1.6T-DR8 1.6T OSFP-XD DR8 PAM4 1311nm 2km MPO-16 SMF وحدة الإرسال والاستقبال الضوئية $12000.00