بسبب سوء فهم قانون التوسع، أطلقت NVIDIA برنامج Blackwell & Rubin

بدأت بطولة "سوبر بول" لصناعة الذكاء الاصطناعي، ونجمها اليوم هو جينسن هوانج.

توافد رواد الأعمال في مجال التكنولوجيا والمطورون والعلماء والمستثمرون وعملاء NVIDIA والشركاء ووسائل الإعلام من جميع أنحاء العالم إلى مدينة سان خوسيه الصغيرة من أجل الرجل ذي السترة الجلدية السوداء.

بدأت الكلمة الرئيسية لهوانج في مؤتمر GTC 2025 في تمام الساعة العاشرة صباحًا بالتوقيت المحلي يوم 10 مارس، ولكن بحلول الساعة السادسة صباحًا، كان أبراهام جوميز، مؤسس شركة Doges AI، قد حجز مكانه في المركز الثاني في الصف الأول بمركز SAP، على أمل "الحصول على مقعد في الصف الأمامي". وبحلول الساعة الثامنة صباحًا، امتد الصف الخارجي لأكثر من كيلومتر.

جلس بيل، الرئيس التنفيذي لشركة وندرا الناشئة في مجال توليد الموسيقى، في الصف الأمامي مرتديًا سترته الجلدية السوداء "تحيةً لجينسن". وبينما كان الحضور متحمسًا، تبنى هوانغ نبرةً أكثر اعتدالًا مقارنةً بنشاطه النجمي العام الماضي. هذه المرة، سعى إلى تأكيد استراتيجية إنفيديا، مؤكدًا مرارًا وتكرارًا على "التوسع" طوال خطابه.

في العام الماضي، أعلن هوانغ أن "المستقبل مُبدع"، وهذا العام، أكد أن "الذكاء الاصطناعي في نقطة تحول". ركز خطابه الرئيسي على ثلاثة إعلانات رئيسية:

1. دخلت وحدة معالجة الرسومات من بلاكويل مرحلة الإنتاج الكامل

قال هوانغ: "الطلب هائل، ولسبب وجيه، فالذكاء الاصطناعي يمر بمرحلة تحول". وسلط الضوء على الحاجة المتزايدة إلى قوة حوسبة مدعومة بأنظمة استنتاج الذكاء الاصطناعي وأحمال عمل التدريب الوكيل.

2. جهاز Blackwell NVLink 72 مع برنامج Dynamo AI

تُقدّم المنصة الجديدة أداءً مُصنّعًا للذكاء الاصطناعي يفوق أداء NVIDIA Hopper بأربعين ضعفًا. وأوضح هوانغ: "مع توسّعنا في مجال الذكاء الاصطناعي، سيُهيمن الاستدلال على أعباء العمل خلال العقد المُقبل". وفي معرض تقديمه لـ Blackwell Ultra، أعاد إحياء مقولة قديمة: "كلما زادت مشترياتك، زادت مدخراتك. بل والأفضل من ذلك، كلما زادت مشترياتك، زادت أرباحك".

3. خارطة الطريق السنوية لشركة NVIDIA للبنية التحتية للذكاء الاصطناعي

حددت الشركة ثلاثة ركائز أساسية للبنية التحتية للذكاء الاصطناعي: السحابة، والمؤسسات، والروبوتات.

الذكاء الاصطناعي لكل صناعة

وكشف هوانج أيضًا عن اثنين من وحدات معالجة الرسوميات الجديدة: Blackwell Ultra GB300 (نسخة مطورة من Blackwell) والهندسة المعمارية Vera Rubin من الجيل التالي مع Rubin Ultra.

كشفت شركة NVIDIA عن اثنين من وحدات معالجة الرسوميات الجديدة: Blackwell Ultra GB300، وهي نسخة مطورة من Blackwell التي صدرت العام الماضي، وهندسة شريحة جديدة كلياً تدعى Vera Rubin، إلى جانب Rubin Ultra.

إن إيمان جينسن هوانج الراسخ بقانون التوسع متجذر في التقدم الذي تم تحقيقه من خلال عدة أجيال من هياكل الرقائق.

ركز خطابه الرئيسي في المقام الأول على "الحوسبة المتطرفة لاستدلال الذكاء الاصطناعي على نطاق واسع".

في مجال استدلال الذكاء الاصطناعي، يتطلب التوسع من مستخدمين فرديين إلى عمليات نشر واسعة النطاق تحقيق التوازن الأمثل بين الأداء والفعالية من حيث التكلفة. يجب ألا تقتصر الأنظمة على ضمان سرعة استجابات المستخدمين فحسب، بل يجب أيضًا تعظيم الإنتاجية الإجمالية (عدد الرموز في الثانية) من خلال تعزيز قدرات الأجهزة (مثل FLOPS وعرض نطاق HBM) وتحسين البرمجيات (مثل البنية والخوارزميات)، مما يُطلق العنان في نهاية المطاف للقيمة الاقتصادية للاستدلال واسع النطاق.

الاستدلال على نطاق واسع هو الحوسبة المتطرفة

وفي معرض تناوله للمخاوف بشأن تباطؤ قانون التوسع، أعرب جينسن هوانج عن وجهة نظر متناقضة، مدعيا أن "أساليب وتقنيات التوسع الناشئة تعمل على تسريع تحسين الذكاء الاصطناعي بوتيرة غير مسبوقة".

وفي مواجهة ضغوط كبيرة، بدا هوانج متوترا بشكل واضح أثناء البث المباشر، وكان يشرب الماء بشكل متكرر أثناء فترات الراحة، وكان صوته أجش قليلا في نهاية عرضه.

مع انتقال سوق الذكاء الاصطناعي من "التدريب" إلى "الاستدلال"، يُقدّم منافسون مثل AMD وIntel وGoogle وAmazon شرائح استدلال متخصصة لتقليل الاعتماد على NVIDIA. في الوقت نفسه، تُسرّع شركات ناشئة مثل Cerebras وGroq وTenstorrent تطوير مُسرّعات الذكاء الاصطناعي، وتهدف شركات مثل DeepSeek إلى تقليل الاعتماد على وحدات معالجة الرسومات (GPUs) باهظة الثمن من خلال تحسين نماذجها. تُساهم هذه الديناميكيات في التحديات التي يواجهها هوانغ. فبينما تُهيمن NVIDIA على أكثر من 90% من سوق التدريب، يُصرّ هوانغ على عدم التخلي عن سوق الاستدلال في ظلّ المنافسة المُشتدّة. وقد طرحت لافتة المشاركة في الفعالية سؤالًا جريئًا: "القادم في الذكاء الاصطناعي يبدأ من هنا".

ما هو التالي في الذكاء الاصطناعي يبدأ هنا

تتضمن النقاط الرئيسية في الخطاب الرئيسي الذي ألقاه جينسن هوانغ، كما لخصها موقع "FiberMall" في الموقع، ما يلي:

لقد أساء العالم فهم قانون القياس

مثّل الذكاء الاصطناعي فرصةً ثوريةً لشركة NVIDIA على مدار العقد الماضي، ولا يزال هوانغ واثقًا تمامًا من إمكاناته. في هذه الجلسة العامة، استعرض شريحتين من خطابه الرئيسي في معرض CES لشهر يناير:

تناولت الشريحة الأولى مراحل تطوير الذكاء الاصطناعي: الذكاء الاصطناعي الإدراكي، والذكاء الاصطناعي التوليدي، والذكاء الاصطناعي الوكيل، والذكاء الاصطناعي المادي.

مراحل تطوير الذكاء الاصطناعي

الشريحة الثانية تصور المراحل الثلاث لقانون التوسع: التوسع قبل التدريب، والتوسع بعد التدريب، والتوسع في وقت الاختبار (التفكير الطويل).

المراحل الثلاث لقانون القياس

قدّم هوانغ وجهة نظرٍ تتناقض بشكلٍ حاد مع الآراء السائدة، مؤكدًا أن المخاوف بشأن تباطؤ قانون التوسع في غير محلها. ويرى أن أساليب وتقنيات التوسع الناشئة تُحفّز تقدم الذكاء الاصطناعي بوتيرةٍ غير مسبوقة.

إيمانًا راسخًا بقانون التوسع، ينبع قناعة هوانغ من ارتباط تطورات الذكاء الاصطناعي العالمية ارتباطًا وثيقًا بأعمال إنفيديا في مجال وحدات معالجة الرسومات. وواصل وصف تطور الذكاء الاصطناعي القادر على "التفكير خطوة بخطوة"، مشددًا على دور الاستدلال والتعلم التعزيزي في تلبية المتطلبات الحاسوبية. ومع وصول الذكاء الاصطناعي إلى "نقطة تحول"، يزداد طلب مزودي الخدمات السحابية على وحدات معالجة الرسومات، حيث يُقدّر هوانغ أن قيمة بناء مراكز البيانات ستصل إلى تريليون دولار.

أوضح هوانغ أن مكتبات تسريع وحدة معالجة الرسومات NVIDIA CUDA-X والخدمات المصغرة تخدم الآن جميع الصناعات تقريبًا. وفي رؤيته، ستدير كل شركة مصنعين في المستقبل: أحدهما لإنتاج السلع والآخر لتوليد الذكاء الاصطناعي.

وحدة معالجة الرسومات CUDA-X

يتوسع الذكاء الاصطناعي في مجالات متنوعة حول العالم، بما في ذلك الروبوتات، والمركبات ذاتية القيادة، والمصانع، والشبكات اللاسلكية. وسلط جنسن هوانغ الضوء على أن أحد أقدم تطبيقات الذكاء الاصطناعي كان في المركبات ذاتية القيادة، قائلاً: "تُستخدم التقنيات التي طورناها تقريبًا من قِبل جميع شركات المركبات ذاتية القيادة"، سواءً في مراكز البيانات أو في قطاع صناعة السيارات.

أعلن جنسن عن إنجازٍ هام في مجال القيادة الذاتية: تعتمد جنرال موتورز، أكبر شركة لتصنيع السيارات في الولايات المتحدة، تقنيات الذكاء الاصطناعي والمحاكاة والحوسبة المُسرّعة من إنفيديا لتطوير الجيل القادم من المركبات والمصانع وروبوتاتها. كما قدّم نظام إنفيديا هالوس، وهو نظام أمان متكامل يجمع بين حلول سلامة أجهزة وبرامج إنفيديا للسيارات مع أحدث أبحاث الذكاء الاصطناعي في مجال سلامة المركبات ذاتية القيادة.

سيارة مستقلة

بالانتقال إلى مراكز البيانات والاستدلال، أشار هوانغ إلى أن نظام NVIDIA Blackwell قد دخل مرحلة الإنتاج الكامل، حيث يعرض أنظمة من شركاء متعددين في الصناعة. وأعرب عن سعادته بإمكانيات Blackwell، وشرح بالتفصيل كيف يدعم قابلية التوسع القصوى، موضحًا: "نهدف إلى معالجة تحدٍّ بالغ الأهمية، وهذا ما نسميه الاستدلال".

أكد هوانغ أن الاستدلال يتضمن توليد الرموز، وهي عملية أساسية للشركات. يجب بناء مصانع الذكاء الاصطناعي التي تُولّد الرموز بكفاءة وأداء استثنائيين. ومع أحدث نماذج الاستدلال القادرة على حل المشكلات المتزايدة التعقيد، سيستمر الطلب على الرموز في الارتفاع.

لتسريع الاستدلال واسع النطاق، أعلن هوانغ عن منصة NVIDIA Dynamo، وهي منصة برمجية مفتوحة المصدر مصممة لتحسين نماذج الاستدلال وتوسيع نطاقها في مصانع الذكاء الاصطناعي. ووصفها بأنها "نظام التشغيل الأساسي لمصانع الذكاء الاصطناعي"، مؤكدًا على إمكاناتها التحويلية.

الإعلان عن دينامو إنفيديا

"اشترِ أكثر، وفّر أكثر، اربح أكثر"

وكشفت NVIDIA أيضًا عن اثنين من وحدات معالجة الرسوميات الجديدة: Blackwell Ultra GB300، وهي نسخة مطورة من Blackwell التي صدرت العام الماضي، والجيل التالي من معماريات Vera Rubin وRubin Ultra.

سيكون الهاتف Blackwell Ultra GB300 متاحًا في النصف الثاني من هذا العام.

ومن المقرر إطلاق فيلم Vera Rubin في النصف الثاني من العام المقبل.

من المتوقع أن يتم إطلاق Rubin Ultra في أواخر عام 2027.

بالإضافة إلى ذلك، كشف هوانغ عن خارطة الطريق للرقائق الإلكترونية القادمة. أُطلق على بنية الجيل الذي يلي روبين اسم فاينمان، والمتوقع أن يكون في عام ٢٠٢٨. ويُرجّح أن يكون الاسم تكريمًا للفيزيائي النظري الشهير ريتشارد فاينمان.

استمرارًا لتقليد NVIDIA، تم تسمية كل بنية GPU على اسم علماء بارزين - Blackwell على اسم الإحصائي David Harold Blackwell، و Rubin على اسم Vera Rubin، عالمة الفيزياء الفلكية الرائدة التي أكدت وجود المادة المظلمة.

نفيدي يمهد الطريق

على مدار العقد الماضي، أصدرت إنفيديا 13 جيلًا من معماريات وحدات معالجة الرسومات، بمعدل جيل جديد سنويًا. ومن بين هذه الأجيال أسماء شهيرة مثل تيسلا، وفيرمي، وكيبلر، وماكسويل، وباسكال، وتورينج، وأمبير، وهوبر، ومؤخرًا روبين. وكان التزام هوانغ بقانون التوسع دافعًا قويًا وراء هذه الابتكارات.

فيما يتعلق بالأداء، يقدم Blackwell Ultra ترقيات كبيرة مقارنةً بـ Blackwell، بما في ذلك زيادة سعة ذاكرة HBM3e من 192 جيجابايت إلى 288 جيجابايت. كما قارنت NVIDIA Blackwell Ultra بشريحة H100 الصادرة عام 2022، مشيرةً إلى قدرتها على تقديم أداء استدلالي أعلى بمرة ونصف من FP1.5. وهذا يُترجم إلى ميزة كبيرة: إذ يمكن لمجموعة NVL4 التي تعمل بنموذج DeepSeek-R72 1B تقديم استجابات تفاعلية في 671 ثوانٍ، مقارنةً بدقيقة ونصف مع H10. يعالج Blackwell Ultra 1.5 رمز في الثانية، أي عشرة أضعاف أداء H100.

بلاكويل ألترا NVL72

ستقدم NVIDIA أيضًا نظام GB300 NVL72 أحادي الرف، والذي يتميز بما يلي:

1.1 إكسافلوب من FP4،

20 تيرابايت من ذاكرة HBM،

40 تيرابايت من "الذاكرة السريعة"

130 تيرابايت/ثانية من عرض النطاق الترددي NVLink، و

سرعة الشبكة 14.4 تيرابايت/ثانية.

أقرّ هوانغ بالأداء المذهل لشاي بلاكويل ألترا، ومازحه بشأن مخاوفه من احتمال عزوف العملاء عن شراء H100. ووصف نفسه مازحًا بأنه "أكبر مُدمّر للإيرادات"، مُقرًا بأنه في حالات محدودة، تكون رقائق هوبر "جيدة"، لكن مثل هذه الحالات نادرة. واختتم حديثه بعبارته الشهيرة، مُعلنًا: "اشترِ أكثر، ووفّر أكثر. بل أفضل من ذلك. الآن، كلما اشتريت أكثر، زادت أرباحك".

تُمثل بنية روبين خطوةً رائدةً لشركة إنفيديا. وأكد جنسن هوانغ: "في جوهرها، كل شيء جديدٌ تمامًا، باستثناء الحامل".

أداء مُحسَّن لـ FP4: تُحقق وحدات معالجة الرسوميات Rubin سرعة 50 بيتافلوب، متجاوزةً بذلك أداء Blackwell البالغ 20 بيتافلوب. يتألف Rubin Ultra من شريحة واحدة مع وحدتي معالجة رسوميات Rubin متصلتين، مما يُوفر أداءً يصل إلى 100 بيتافلوب من FP4 - أي ضعف أداء Rubin - ويضاعف سعة الذاكرة إلى أربعة أضعاف تقريبًا لتصل إلى 1 تيرابايت.

NVL576 Rubin Ultra Rack: يوفر 15 إكسافلوب من استدلال FP4 و5 إكسافلوب من تدريب FP8، ويفتخر بالأداء 14 مرة أكبر من رفوف Blackwell Ultra.

نظام نفيديا روبين

كما شرح هوانغ دمج تقنية الفوتونيات في أنظمة التوسع، ودمجها في مفاتيح الشبكة الفوتونية السيليكونية Spectrum-X وQuantum-X من NVIDIA. تجمع هذه الابتكارات بين الاتصالات الإلكترونية والبصرية، مما يُمكّن مصانع الذكاء الاصطناعي من ربط ملايين وحدات معالجة الرسومات (GPU) عبر مواقعها، مع تقليل استهلاك الطاقة والتكاليف.

مفاتيح الشبكة الفوتونية

تتمتع هذه المفاتيح بكفاءة استثنائية، حيث تحقق كفاءة طاقة أكبر بـ 3.5 مرة، وسلامة إشارة أكبر بـ 63 مرة، ومرونة شبكة أكبر بـ 10 مرات، ونشر أسرع مقارنة بالطرق التقليدية.

أجهزة الكمبيوتر لعصر الذكاء الاصطناعي

تجاوزت إنفيديا نطاق شرائح الحوسبة السحابية ومراكز البيانات، حيث أطلقت حواسيب مكتبية فائقة الذكاء الاصطناعي تعمل بمنصة إنفيديا غريس بلاكويل. صُممت هذه الأجهزة لمطوري الذكاء الاصطناعي والباحثين وعلماء البيانات والطلاب، حيث تُمكّن من إنشاء النماذج الأولية وضبطها بدقة واستنتاج نماذج كبيرة على مستوى سطح المكتب.

أجهزة الكمبيوتر العملاقة ذات الذكاء الاصطناعي المكتبي

تشمل المنتجات الرئيسية ما يلي:

أجهزة الكمبيوتر العملاقة DGX: تتميز بمنصة NVIDIA Grace Blackwell لإمكانيات نشر محلية أو سحابية لا مثيل لها.

محطة DGX: محطة عمل عالية الأداء مجهزة بنظام Blackwell Ultra.

بلاكويل الترا

سلسلة لاما نيموترون للاستدلال: مجموعة نماذج ذكاء اصطناعي مفتوحة المصدر تُحسّن التفكير والترميز واتخاذ القرارات متعددة الخطوات. تُحسّن تحسينات إنفيديا الدقة بنسبة 20%، وسرعة الاستدلال 5 مرات، وكفاءة التكلفة التشغيلية. تتعاون شركات رائدة مثل مايكروسوفت، وساب، وأكسنتشر مع إنفيديا لتطوير نماذج استدلال جديدة.

عصر الروبوتات متعددة الأغراض

أعلن جنسن هوانغ أن الروبوتات هي الصناعة القادمة التي تبلغ قيمتها 10 تريليونات دولار، مُعالجًا بذلك نقصًا عالميًا في الأيدي العاملة، من المتوقع أن يصل إلى 50 مليون عامل بحلول نهاية القرن. كشفت إنفيديا عن نموذج Isaac GR00T N1، أول نموذج مفتوح وقابل للتخصيص بالكامل في العالم للاستدلال وتأسيس المهارات البشرية، بالإضافة إلى إطار عمل جديد لتوليد البيانات وتعلم الروبوتات. يمهد هذا الطريق لآفاق جديدة في مجال الذكاء الاصطناعي.

بالإضافة إلى ذلك، أصدرت NVIDIA نموذج Cosmos Foundation لتطوير الذكاء الاصطناعي المادي. يُمكّن هذا النموذج المفتوح والقابل للتخصيص المطورين من تحكم غير مسبوق في توليد العوالم، مما يُنشئ مجموعات بيانات هائلة وغير محدودة بشكل منهجي من خلال التكامل مع Omniverse.

قدّم هوانغ أيضًا نيوتن، وهو محرك فيزيائي مفتوح المصدر لمحاكاة الروبوتات، طُوّر بالتعاون مع جوجل ديب مايند وديزني ريسيرش. وفي لحظة لا تُنسى، ظهر روبوت صغير يُدعى "بلو"، والذي سبق أن ظهر في مؤتمر GTC العام الماضي، على المسرح مجددًا، مُبهجًا الحضور.

أزرق

لطالما ركّزت رحلة NVIDIA المستمرة على إيجاد تطبيقات لوحدات معالجة الرسومات الخاصة بها، بدءًا من الإنجازات الرائدة في مجال الذكاء الاصطناعي مع AlexNet قبل أكثر من عقد، وصولًا إلى تركيزها اليوم على الروبوتات والذكاء الاصطناعي المادي. فهل ستُثمر طموحات NVIDIA للعقد القادم؟ سيُظهر لنا الزمن ذلك.

اترك تعليق

انتقل إلى الأعلى