وبحسب صحيفة Economic Daily News التايوانية، تخطط شركة NVIDIA لإطلاق خط إنتاج خوادم GB300 AI من الجيل التالي في مؤتمر GTC في مارس من العام المقبل.
في الآونة الأخيرة، بدأت فوكسكون وكوانتا بشكل استباقي في البحث والتطوير لـGB300 لاغتنام الفرصة مبكرًا. ومن المفهوم أن إنفيديا قد حددت مبدئيًا تكوين طلب GB300، مع بقاء فوكسكون أكبر مورد لها. ومن المتوقع أن يصل GB300 إلى السوق في النصف الأول من العام المقبل، متقدمًا على المنافسين العالميين. تكشف مصادر الصناعة أن كوانتا وإنفنتك هما أيضًا شريكان رئيسيان لخوادم GB300 AI من إنفيديا. تحتل كوانتا المرتبة الثانية بعد فوكسكون في حصة الطلب، بينما زادت إنفنتك بشكل كبير من حصة طلبها مقارنة بـGB200، مما يجعلها في وضع يسمح لها بالاستفادة من فرص الجيل التالي من GB300.
وحدة معالجة الرسوميات: B200 → B300
في أكتوبر من هذا العام، قامت NVIDIA بإعادة تسمية جميع منتجات Blackwell Ultra إلى سلسلة B300، والتي تستخدم تقنية CoWoS-L، مما أدى إلى زيادة الطلب على حلول التغليف المتقدمة.
تعزيز الأداء
توفر وحدة معالجة الرسوميات الجديدة B300 زيادة قدرها 1.5 ضعف في أداء الحوسبة ذات الفاصلة العائمة (FP4) مقارنة بـ B200 السابقة.
الطاقة الحرارية TDP
يمكن أن يصل استهلاك الطاقة لوحدة معالجة الرسوميات B300 إلى 1400 وات، مقارنة بنحو 1000 وات لوحدة معالجة الرسوميات B200، وهو ما يمثل قفزة كبيرة. وللحفاظ على هذه الطاقة الكبيرة، يتعين على كل من مصدر الطاقة وأنظمة التبريد مواكبة ذلك.
نظام تبريد سائل متطور
صفيحة تبريد سائلة + موصل UQD سريع التغيير المحسن: إن استهلاك الطاقة الذي يبلغ 1400 واط يجعل التبريد الهوائي غير كافٍ. لذلك، يستخدم GB300 صفيحة تبريد سائلة ويقوم بترقية موصلات UQD سريعة التغيير لتحسين الكفاءة والموثوقية.
تصميم الخزانة الجديد: تم إعادة تصميم مخطط الخزانة وتصميم خط الأنابيب وقنوات التبريد لاستيعاب أعداد متزايدة من ألواح التبريد المائي وأنظمة التبريد السائل ومكونات التوصيل السريع UQD.
ترقية كبيرة لذاكرة HBM3e
192 جيجابايت → 288 جيجابايت: هل تتذكر ذاكرة HBM192 بسعة 3 جيجابايت في عصر GB200؟ الآن، تتميز كل وحدة معالجة رسوميات B300 بسعة مذهلة تبلغ 288 جيجابايت من HBM3e! هذه الزيادة الكبيرة هي في الأساس ضوء أخضر للتدريب المكثف للنماذج، مما يجعلها جذابة للغاية للنماذج الكبيرة ذات مئات المليارات من المعلمات.
تكديس 8 طبقات → 12 طبقة: بالمقارنة مع تكديس 8 طبقات السابق، يستخدم التكوين الجديد تكديسًا من 12 طبقة - ليس فقط لزيادة السعة ولكن أيضًا لتحسين النطاق الترددي بشكل كبير. يسمح هذا التوازي العالي بتدفق البيانات بسلاسة دون اختناقات.
الشبكة والنقل
بطاقة الشبكة: ConnectX 7 → ConnectX 8: تمت ترقية GB300 من بطاقة الشبكة ConnectX 7 إلى ConnectX 8. توفر هذه الترقية تحسينات شاملة في النطاق الترددي ووقت الاستجابة والموثوقية، مما يضمن نقل البيانات بسلاسة في مجموعات واسعة النطاق.
الوحدات البصرية: 800G → 1.6T: إن الترقية من 800G إلى 1.6T تُضاهي التحول من الترس الثاني إلى الترس الرابع. وفي السيناريوهات التي تنطوي على تفاعلات بيانات ضخمة، مثل الحوسبة عالية الأداء والتدريب على الذكاء الاصطناعي، فإن زيادة النطاق الترددي هذه تُعَد منقذة للحياة.
إدارة الطاقة والموثوقية
إضافات جديدة: صينية مكثف موحدة ووحدة BBU: تتميز خزانة GB300 NVL72 الآن بصينية مكثف موحدة مع نظام وحدة BBU اختياري. تبلغ تكلفة كل وحدة BBU حوالي 300 دولار، ويتطلب نظام GB300 بالكامل حوالي 5 وحدات BBU، بإجمالي حوالي 1500 دولار. وبينما قد يبدو هذا مكلفًا، إلا أنه استثمار بالغ الأهمية لتجنب انقطاع التيار الكهربائي المفاجئ في بيئات الذكاء الاصطناعي عالية الأحمال وعالية الطاقة.
الطلب المرتفع على المكثفات الفائقة: يتطلب كل رف NVL72 أكثر من 300 مكثف فائق للتعامل مع ارتفاعات التيار اللحظية وحماية النظام. وبسعر يتراوح بين 20 و25 دولارًا لكل منهما، يمثل هذا تكلفة كبيرة ولكنه ضروري لـ GB300 المتعطشة للطاقة.
ثورة الذاكرة الكبرى
LPCAMM تدخل مرحلة الخوادم: لأول مرة، قدمت NVIDIA معيار LPCAMM (Low Power CAMM) إلى لوحات الحوسبة الخادمة. بعد أن شوهد سابقًا في أجهزة الكمبيوتر المحمولة خفيفة الوزن، يتولى هذا "الرجل الصغير" الآن متطلبات الأحمال العالية للخوادم، مما يثبت قدراته الاستثنائية. يشير تقديم LPCAMM في الخوادم إلى اتجاه نحو جعلها "أكثر نحافة وأناقة"، مما يشير إلى تحول محتمل نحو نهج أكثر عصرية في تصميم الخوادم.
هل تحل LPCAMM محل وحدات DIMM التقليدية؟ توفر LPCAMM حلاً أكثر إحكاما وكفاءة في استخدام الطاقة وسهولة الصيانة. وقد تحل محل وحدات RDIMM وLRDIMM التقليدية بالكامل في المستقبل، مما قد يتسبب في حدوث تغيير كبير في سوق ذاكرة الخادم. وإذا حلت LPCAMM محل وحدات DIMM التقليدية، فقد يبشر ذلك بتحول كبير في مشهد ذاكرة الخادم.
من المقرر أن ترفع NVIDIA GB300 "Blackwell Ultra" سقف قوة الحوسبة بالذكاء الاصطناعي بشكل كبير. تشير التحسينات في نوى وحدة معالجة الرسومات، ودعم ذاكرة HBM3e الهائل، والترقيات الشاملة في التبريد وإدارة الطاقة، إلى أن النماذج الكبيرة والحوسبة واسعة النطاق هي اتجاهات لا يمكن إيقافها في المستقبل. بالإضافة إلى ذلك، مع تضمين LPCAMM وعرض النطاق الترددي للشبكة 1.6T، سيتم تعزيز كفاءة مراكز البيانات السحابية ومراكز الحوسبة الفائقة.
من الواضح أن "سباق التسلح" للحصول على قوة الحوسبة القائمة على الذكاء الاصطناعي لم يبدأ بعد. وربما يهيمن أولئك الذين يتولون زمام المبادرة في أنظمة الأجهزة والبرامج على الموجة التالية من ثورة الذكاء الاصطناعي.