التحليل المتعمق وتوصيف الأداء لمحول NV

مما لا شك فيه أن تقنية GPU من NVIDIA تتألق بشكل مشرق في مشهد الحوسبة عالية الأداء اليوم. مع التطور السريع للذكاء الاصطناعي والتعلم الآلي، يستمر الطلب على الطاقة الحاسوبية في النمو، مما يجعل الترابط بين وحدات معالجة الرسومات أمرًا بالغ الأهمية بشكل متزايد. على هذه الخلفية، قدمت NVIDIA بروتوكول NVLink وحل التوصيل البيني لوحدات معالجة الرسومات المتعددة استنادًا إلى هذه التقنية: NV Switch.

يتعمق هذا القسم في تاريخ التطوير ومبادئ العمل والدور الرئيسي لـ NV Switch في بناء مجموعات خوادم عالية الأداء، ويكشف النقاب عن الجوانب الغامضة لهذه التقنية.

لماذا هناك حاجة إلى مفتاح NV

مع اقتراب القدرات الحسابية لوحدة معالجة الرسومات الفردية من الحدود المادية، يصبح العمل التعاوني بين وحدات معالجة الرسومات المتعددة اتجاهًا لا مفر منه.

القدرات الحسابية GPU الفردية

ومع ذلك، فإن الوصول إلى ذاكرة HBM2 الخاصة بوحدات معالجة الرسومات الأخرى يتطلب اجتياز واجهة PCIe. كما هو موضح في الرسم البياني أعلاه، فإن واجهات PCIe التقليدية لها قيود في معدلات نقل البيانات وعرض النطاق الترددي، وغالبًا ما تصبح اختناقات في أداء اتصالات وحدة معالجة الرسومات. وللتغلب على هذا القيد، قامت NVIDIA بتطوير تقنية NVLink، التي توفر عشرة أضعاف عرض النطاق الترددي الذي يوفره PCIe. فهو يسمح لثمانية وحدات معالجة رسوميات داخل خادم واحد بالاتصال عبر شبكات من نقطة إلى نقطة، وتشكيل شبكة مختلطة مكعبة.

تكمن الميزة الأساسية لـ NVLink في تجاوز آليات تخصيص وجدولة وحدة المعالجة المركزية التقليدية، مما يتيح تبادل البيانات مباشرة بين وحدات معالجة الرسومات. يقلل هذا التصميم من زمن انتقال البيانات ويعزز بشكل كبير إنتاجية النظام بشكل عام. بالإضافة إلى ذلك، تسمح وحدات NVlink GPCs بالوصول إلى بيانات ذاكرة HBM2 بين البطاقات وتمكين التفاعل مع بيانات HBM2 داخل وحدات معالجة الرسومات الأخرى.

في الأنظمة متعددة وحدات معالجة الرسومات، تعمل NVLINK أيضًا كوحدات XBAR، حيث تعمل كجسور بين وحدات معالجة الرسومات المختلفة، مما يسمح بتدفق البيانات بحرية. فهو يتجنب بذكاء التعارضات مع ناقل PCIe، مما يسمح لـ NVLink وPCIe بالتعايش كحلول تكميلية، مما يوفر بشكل جماعي إمكانات نقل البيانات اللازمة للنظام.

يعتمد NV Switch على هذا الأساس، حيث يدعم أنظمة GPU المترابطة بالكامل وغير المحظورة. ومن خلال توفير المزيد من واجهات NVLink دون أي قفزات وسيطة لوحدة معالجة الرسومات، فإنها تتيح إمكانية الاتصال البيني لوحدة معالجة الرسومات على نطاق أوسع، مما يؤدي إلى مجموعات حوسبة أكثر قوة.

في التطور التكنولوجي لـ NVIDIA، قدمت بنية Pascal لأول مرة NVLink، مما أدى إلى تحسين كفاءة اتصال GPU بشكل كبير من خلال إنشاء قناة عالية السرعة. ومع ذلك، حدثت القفزة الحقيقية في الجيل التالي من بنية فولتا، مصحوبة بولادة NVSwitch.

يعمل NVSwitch كمركز ذكي في شبكة نقل البيانات، ويدعم روابط NVLink الإضافية ويسمح بالاتصال البيني الكامل بين وحدات معالجة الرسومات المتعددة. إنه يحسن بشكل كبير كفاءة ومرونة تبادل البيانات.

الترابط الكامل بين وحدات معالجة الرسومات المتعددة

كما هو موضح في الشكل، حققت بنية Volta اتصالاً بسرعة 300 جيجابايت/ثانية بين وحدات معالجة الرسومات، بينما تقدمت بنية Hopper إلى 900 جيجابايت/ثانية. وراء هذا الإنجاز تكمن الزيادة الكبيرة في عدد وصلات NVLink، حيث توسعت من 6 في فولتا إلى 18 في هوبر. إنه يشبه إضافة الجسور والدوارات إلى الطريق السريع الأصلي، مما يتيح تدفق بيانات أكثر كفاءة بين وحدات معالجة الرسومات وتوفير دعم قوي للحوسبة عالية الأداء والمعالجة المتوازية واسعة النطاق.

حققت بنية فولتا اتصالاً يصل إلى 300 جيجا

يوضح الرسم البياني أعلاه بنية اتصالات GPU البينية في خوادم DGX. في DGX-1 P100، هناك 8 بطاقات GPU، تدعم كل منها 4 روابط NVLink التي تسمح بالاتصال عالي السرعة بين وحدات معالجة الرسومات. يتم تنظيم وحدات معالجة الرسومات هذه في شبكتين مكعبتين، حيث يحتوي كل مكعب على 4 وحدات معالجة رسوميات (GPU 0~3 وGPU 4~7). داخل كل مكعب، يمكن لوحدات معالجة الرسومات الاتصال مباشرة عبر NVLink أو من خلال مفتاح PCIe. ومع ذلك، يتطلب الاتصال عبر المكعبات (على سبيل المثال، بين GPU 0 وGPU 4) توجيهًا غير مباشر عبر وحدات معالجة الرسومات الأخرى.

قدمت DGX-2 الجيل الأول من تقنية NVSwitch من NVIDIA، وهو تقدم كبير يتيح اتصالاً أكثر كفاءة بين وحدات معالجة الرسومات. في بنية Volta، تدعم كل بطاقة GPU 6 روابط NVLink (بدلاً من 4). بالإضافة إلى ذلك، من خلال دمج 6 NVSwitches، يقوم DGX-2 بتوصيل جميع وحدات معالجة الرسومات في الخادم، مما يسمح بالاتصال المتزامن بين 8 أزواج من وحدات معالجة الرسومات دون قفزات وسيطة. يعمل هذا الاتصال المباشر عالي السرعة على تحسين كفاءة نقل البيانات والأداء الحسابي الشامل بشكل كبير.

يستخدم DGX-A100 تقنية NVSwitch من الجيل الثاني. بالمقارنة مع الجيل الأول، يوفر الجيل الثاني من NVSwitch نطاقًا تردديًا أعلى للاتصالات وزمن وصول أقل. في بنية A100، تدعم كل بطاقة GPU 12 رابط NVLink (الجيل الثالث)، وتقوم 6 NVSwitches بإنشاء طوبولوجيا شبكة متصلة بالكامل. على الرغم من أن تكوين DGX A100 القياسي يتضمن 8 بطاقات GPU فقط، إلا أنه يمكن توسيع النظام لدعم المزيد من وحدات معالجة الرسومات A100 وNVSwitches للحوسبة الفائقة على نطاق أوسع.

يستخدم DGX-H100 تقنيات NVSwitch من الجيل الثالث والجيل الرابع من NVLink. تدعم كل بطاقة GPU 18 رابط NVLink. في بنية H100، تم تقديم 4 مفاتيح NVSwitch، باستخدام طوبولوجيا ذات طبقات: تتصل كل بطاقة بـ NVSwitch الأول بـ 5 روابط، وNVSwitch الثاني بـ 4 روابط، وNVSwitch الثالث بـ 4 روابط، وNVSwitch الرابع بـ 5 روابط. وينتج عن ذلك إجمالي 72 وصلة NVLink توفر عرض نطاق ترددي لشبكة NVLink ثنائية الاتجاه يبلغ 3.6 تيرابايت/ثانية، وهو تحسن بمقدار 1.5x مقارنة بالجيل السابق.

يهدف تصميم NVSwitch الأصلي إلى إنشاء نظام GPU غير محظور ومترابط بالكامل للمعالجة المتوازية واسعة النطاق. في الجيل الأول، دعم NVSwitch 18 واجهة، مما يسمح بتوصيل ما يصل إلى 16 وحدة معالجة رسومات بشكل كامل لمشاركة البيانات والتواصل بكفاءة.

كما هو موضح في مخطط بنية V100، تحتوي كل وحدة معالجة رسومات على 6 قنوات NVLink تتصل بـ NVSwitch، مما يشكل شبكة اتصالات ذات نطاق ترددي عالٍ. في نظام DGX-2، يتم توصيل 8 وحدات معالجة رسومات V100 بـ 6 محولات NVSwitch عبر قنوات NVLink هذه، مما يؤدي إلى إنشاء عمود فقري قوي.

وحدة معالجة رسومات V100

كما هو موضح في الرسم البياني أعلاه، في بنية V100، تحتوي كل وحدة معالجة رسومات على 6 قنوات NVLink يمكنها الاتصال بـ NVSwitch، وتشكيل شبكة اتصالات ذات نطاق ترددي عالٍ. في نظام DGX-2، يتم توصيل 8 وحدات معالجة رسومات V100 بـ 6 محولات NVSwitch عبر قنوات NVLink هذه، مما يؤدي إلى إنشاء عمود فقري قوي.

NVLink

يدعم الجيل الأول من NVSwitch تقنية NVLink 2.0، حيث توفر كل واجهة قنوات مزدوجة ونطاق ترددي يصل إلى 50 جيجابايت/ثانية. وهذا يعني أنه من خلال NVSwitch، يحقق النظام بأكمله نطاقًا تردديًا إجماليًا مثيرًا للإعجاب يبلغ 900 جيجابايت/ثانية، مما يعزز بشكل كبير معدلات نقل البيانات والكفاءة الحسابية.

علاوة على ذلك، يتم تصنيع NVSwitch باستخدام عملية FinFET FFN مقاس 12 نانومتر من TSMC، مما يسمح لها بالعمل بقدرة 100 واط مع دمج ما يصل إلى 200 مليون ترانزستور.

فيما يتعلق بإدخال/إخراج الدائرة وتغليفها، يتم تعبئة NVSwitch في شريحة BGA كبيرة تحتوي على 1940 دبوسًا، 576 منها مخصصة خصيصًا لدعم 18 رابط NVLink. تتعامل المسامير المتبقية مع الطاقة وواجهات الإدخال/الإخراج المتنوعة، بما في ذلك منافذ إدارة PCIe x4، وI2C، وGPIO، مما يوفر إمكانات إدارة وتوسيع مرنة للنظام.

تظهر المعلمات المحددة في الجدول أدناه:

المعلمة nvSwitch

NVLink ثنائي الاتجاه BW حتى 50 جيجابايت/ثانية

الاستخدام الفعلي يصل إلى 80%

كتلة تبديل NV

كتلة تبديل NV

تتضمن كتلة NVSwitch الأولية، كما هو موضح، وحدة معالجة الرسومات XBAR على اليسار. إنه جهاز توصيل متخصص للغاية مصمم لبيئات التوصيل البيني NVLink، مما يسمح لحزم البيانات بالتدفق والتبادل بين وحدات معالجة الرسومات المتعددة أثناء تقديمها خارجيًا كوحدة معالجة رسومات واحدة. من خلال GPU XBAR، يمكن لتطبيقات العميل الاستفادة من الأداء الجماعي لوحدات معالجة الرسومات المتعددة، مما يقلل من تعقيد إدارة الاتصال بين وحدة معالجة الرسومات ووحدة معالجة الرسومات من جانب العميل.

بالإضافة إلى ذلك، يستخدم GPU XBAR تقنية المخزن المؤقت المستندة إلى ذاكرة الوصول العشوائي الثابتة (SRAM) لتحقيق نقل بيانات غير محظور. تضمن آلية التخزين المؤقت هذه الاستمرارية والكفاءة حتى في ظل الأحمال العالية.

بدءًا من وحدة معالجة الرسومات V100، أعادت NVIDIA استخدام كتل NVLink IP وتصميم XBAR، مما يضمن التوافق بين أجيال مختلفة من المنتجات وتمكين التكرار المستمر وتحسين تقنية NVLink مع تقليل تكاليف التطوير والوقت.

nvswitch العنونة المادية

يوضح الرسم البياني أيضًا كيفية قيام NVSwitch ووحدات معالجة الرسومات بتوزيع البيانات ونقلها عبر وحدة معالجة الرسومات بأكملها. في البرمجة، يتعامل المطورون عادةً مع العناوين الافتراضية التي يديرها ويستخلصها نظام التشغيل، مما يوفر مساحات عناوين مستقلة لبرامج مختلفة. ومع ذلك، يتم تخزين البيانات فعليًا باستخدام العناوين الفعلية في الذاكرة. تشير هذه العناوين الفعلية مباشرة إلى مواقع محددة في الذاكرة، مما يشكل الأساس للوصول إلى البيانات. عند إرسال البيانات عبر NVLink، كما هو موضح في الرسم التخطيطي، يتم استخدام العناوين الفعلية بدلاً من العناوين الافتراضية. يعمل هذا الاختيار على تسريع فهرسة البيانات وسرعة الوصول.

إن NVSwitch، باعتباره جهاز التوصيل لـ NVLink، لا يوفر مسار اتصال عالي النطاق فحسب، بل يدير أيضًا آليات التوجيه والتخزين المؤقت المعقدة لضمان نقل حزم البيانات بدقة وسرعة إلى وجهتها بناءً على العنوان الفعلي الصحيح. يؤدي استخدام العناوين الفعلية لاتصالات NVLink إلى تقليل الحاجة إلى ترجمة العناوين على وحدة معالجة الرسومات المستهدفة، وبالتالي تقليل زمن الوصول وتحسين معدلات نقل البيانات. يعد هذا أمرًا بالغ الأهمية للحوسبة عالية الأداء وتطبيقات الذكاء الاصطناعي التي تتطلب معالجة سريعة لكميات كبيرة من البيانات.

NVSwitch: مبادئ وميزات التبسيط

عصابة

في التكوينات التي لا تحتوي على NVSwitch، عادةً ما تتضمن الاتصالات المباشرة من GPU إلى GPU تجميع روابط NVLinks في مجموعات متعددة (يشار إليها باسم "Gangs"). في هذا الإعداد، تتواصل وحدات معالجة الرسومات المتعددة عبر روابط NVLink المشتركة. ومع ذلك، يتمثل أحد قيود هذا النهج في أن الحد الأقصى لعرض النطاق الترددي بين أي وحدتي معالجة رسوميات مقيد بكمية NVLink وعرض النطاق الترددي داخل مجموعاتهما الخاصة.

V100

مقدمة NVSwitch وتحسيناته أحدثت تقنية NVSwitch من NVIDIA ثورة في الاتصال بين وحدات معالجة الرسومات. كمحول عالي السرعة، يسمح NVSwitch بتفاعل البيانات عبر جميع الروابط.

في بنية NVSwitch، يمكن لأي زوج من وحدات معالجة الرسومات الاتصال بشكل مباشر، وطالما لم يتم تجاوز إجمالي عرض النطاق الترددي لستة روابط NVLink، فإن حركة مرور GPU الفردية تحقق نقلًا غير محظور. وهذا يعني أن البنية المترابطة بالكامل التي يدعمها NVSwitch تتيح سهولة توسيع النظام لاستيعاب المزيد من وحدات معالجة الرسومات دون التضحية بالأداء. يمكن لكل وحدة معالجة رسومات الاستفادة من النطاق الترددي العالي الذي يوفره NVLink لتبادل البيانات بسرعة.

مزايا وميزات NVSwitch في التوصيل البيني لوحدات معالجة الرسومات المتعددة:

قابلية التوسع والتوسع: يؤدي إدخال NVSwitch إلى تحسين قابلية التوسع لمجموعات GPU بشكل كبير. بمجرد إضافة المزيد من محولات NVSwitch، يمكن للنظام أن يدعم وحدات معالجة الرسومات الإضافية بسلاسة، مما يؤدي إلى توسيع القدرة الحسابية.

بناء النظام الفعال: على سبيل المثال، يمكن توصيل ثماني وحدات معالجة رسوميات بكفاءة باستخدام ثلاثة محولات NVSwitch. يسمح هذا التصميم بتدفق البيانات بحرية عبر جميع روابط وحدة معالجة الرسومات، مما يزيد من المرونة والكفاءة في تداول البيانات.

استخدام عرض النطاق الترددي ثنائي الاتجاه: في هذا التكوين، يمكن لأي زوج من وحدات معالجة الرسومات الاستفادة من النطاق الترددي ثنائي الاتجاه الكامل البالغ 300 جيجابايت في الثانية للاتصال. تحقق كل وحدة معالجة رسومات نقل بيانات بسرعة عالية وبزمن وصول منخفض، مما يعزز بشكل كبير سرعة معالجة المهام الحسابية.

الاتصالات غير المحظورة: يوفر مفتاح العارضة (XBAR) الموجود داخل NVSwitch مسارًا فريدًا من النقطة A إلى النقطة B لنقل البيانات. ويضمن هذا التصميم اتصالاً خاليًا من التداخل والحجب، مما يزيد من تحسين موثوقية نقل البيانات والأداء العام للنظام.

طوبولوجيا الشبكة المحسنة: يدعم NVSwitch هياكل طوبولوجيا الشبكة التي توفر حلولاً محسّنة لبناء مجموعات GPU واسعة النطاق. يمكن لمصممي النظام تكوين اتصالات GPU-to-GPU بشكل مرن بناءً على متطلبات حسابية محددة.

الجيل الثالث من NVSwitch

الجيل الثالث من NVSwitch

كما هو موضح في الرسم البياني، يتم تصنيع الجيل الثالث من NVSwitch باستخدام عملية TSMC's 4N. على الرغم من وجود عدد كبير من الترانزستورات وعرض النطاق الترددي العالي، إلا أنه يحافظ على استهلاك منخفض نسبيًا للطاقة. فهو يوفر 64 منفذ ربط NVLink 4، مما يتيح إنشاء شبكات معقدة تحتوي على العديد من وحدات معالجة الرسومات مع الحفاظ على اتصال عالي السرعة بين كل وحدة معالجة رسومات. بالإضافة إلى ذلك، فهو يدعم عرض النطاق الترددي ثنائي الاتجاه الذي يبلغ 3.2 تيرابايت/ثانية، مما يعزز بشكل كبير معدلات نقل البيانات ويجعل المعالجة المتوازية واسعة النطاق لمجموعات البيانات أكثر كفاءة.

بالإضافة إلى توصيل بطاقات GPU متعددة داخل الخادم، يمكن للجيل الثالث من NVSwitch أيضًا أن يمتد لتوصيل خوادم GPU خارجيًا، مما يشكل مجموعات GPU كاملة عالية السرعة. يمكن للمحول الفعلي المكون من شرائح NVSwitch من الجيل الثالث إنشاء مجموعات تحتوي على ما يصل إلى 256 وحدة معالجة رسوميات H100، مما يوفر نطاقًا تردديًا إجماليًا يبلغ 57.6 تيرابايت/ثانية.

فيما يتعلق بتكنولوجيا الإشارة، فهي تعتمد إشارة PAM50 بسرعة 4 جيجابت، حيث يوفر كل زوج تفاضلي عرض نطاق ترددي يبلغ 100 جيجابت في الثانية، مما يحافظ على نقل عالي السرعة وزمن وصول منخفض.

يدمج NVSwitch تقنية NVIDIA SHARP، بما في ذلك عمليات مثل all_gather، وreduce_scatter، وbroadcast atomics، مما يؤدي إلى تسريع الاتصال العنقودي وزيادة تحسين الأداء. تتوافق الواجهة الكهربائية المادية لـ NVSwitch 3.0 مع شبكة Ethernet بسرعة 400 جيجابت في الثانية وInfiniBand، مما يضمن إمكانية التشغيل البيني مع تقنيات الشبكة الحالية.

منطق المنفذ

يقدم الجيل الثالث من NVSwitch من NVIDIA العديد من الميزات المبتكرة. يؤدي تضمين وحدة SHARP الجديدة ووحدة NVLink إلى تحسين كفاءة الاتصال ومعالجة البيانات بين وحدات معالجة الرسومات بشكل كبير، كما هو موضح في الرسم التخطيطي.

وحدة شارب الجديدة

تعمل وحدة SHARP التي تم تقديمها حديثًا كموصل ذكي، تقود سيمفونية من البيانات بقدرات المعالجة القوية الخاصة بها. وهو يدعم عوامل تشغيل مختلفة، بدءًا من العمليات المنطقية وحتى العمليات الحسابية، كما أنه متوافق مع تنسيقات بيانات متعددة مثل FP16 وBF16، مما يوفر دعمًا قويًا لأحمال عمل الذكاء الاصطناعي والتعلم الآلي. يسمح تصميم وحدة التحكم SHARP بالإدارة المتوازية لما يصل إلى 128 مجموعة SHARP، على غرار إله متعدد المهام بألف ذراع، مما يعزز بشكل كبير كفاءة المعالجة المتوازية للبيانات.

إن مفتاح العارضة (XBAR) الموجود داخل NVSwitch، والذي تم ضبطه وتحسينه بدقة، يتوافق تمامًا مع متطلبات نقل البيانات لوحدة SHARP. ويضمن هذا التصميم التعاوني نقل البيانات بكفاءة وبزمن وصول منخفض بين وحدات معالجة الرسومات، مما يدفع الأداء العام للنظام مثل الفرس الراكض.

وحدة NVLink الجديدة

لا توفر وحدة NVLink الجديدة المدمجة حماية أمنية إضافية للبيانات والرقائق فحسب، بل تعمل كدرع قوي ضد الوصول غير المصرح به وتسرب البيانات المحتمل، ولكنها تعمل أيضًا على تعزيز أمان البيانات. يؤدي إدخال تقسيم المنافذ، مثل حركة الشطرنج الإستراتيجية، إلى عزل المنافذ المختلفة في شبكات NVLink منفصلة، ​​مما يوفر مرونة أكبر لتقسيم الموارد المنطقية عبر شبكات مختلفة وتحسين قدرات المهام المتعددة.

يضمن دعم الجيل القادم من كبلات Octal Small Formfactor Pluggable (OSFP) أساسًا قويًا لتوسيع الشبكة في المستقبل. توفر هذه الكبلات معدلات نقل بيانات أعلى وتوهينًا أقل للإشارة، مما يجعلها مناسبة للاتصالات عالية السرعة لمسافات طويلة وتمكين إمكانيات لا حصر لها لتوسيع الشبكة.

تعمل وحدة NVLink الجديدة أيضًا على توسيع قدرات القياس عن بعد، مما يسمح لمسؤولي النظام بمراقبة أداء الشبكة وتحسينه بدقة، مما يضمن تشغيل النظام بشكل مستقر. تعمل تقنية تصحيح الأخطاء الأمامية (FEC) المتكاملة كحارس يقظ، مما يعزز موثوقية نقل البيانات، خاصة في مواجهة توهين الإشارة أو التداخل، مما يضمن سلامة البيانات ودقتها.

عندما تستخدم وحدات معالجة الرسومات H100 شبكة NVLink، ما مدى سرعة مقارنتها بوحدات معالجة الرسومات A100 المزودة بشبكة IB؟ لنقارن عرض النطاق الترددي بين DGX A100 256 POD وDGX H100 256 POD:

مقارنة بين شبكات InfiniBand (IB) وNVLink لوحدات معالجة الرسوميات H100

عرض النطاق الترددي الداخلي DGX A100:

كل DGX A100: 8/2 * 600 جيجابايت/ثانية = 2400 جيجابايت/ثانية

عبر 32 بطاقة DGX A100 (256 وحدة معالجة رسوميات A100)، بافتراض 8x 200 جيجابت في الثانية من بطاقات NIC ذات النطاق الديناميكي العالي لكل خادم ونسبة تقارب محول TOR تبلغ 4:1:

إجمالي عرض النطاق الترددي = 256/2/4 * 200 جيجابايت/ثانية = 6400 جيجابايت/ثانية

عرض النطاق الترددي الداخلي DGX H100:

كل DGX H100: 8/2 * 900 جيجابايت/ثانية = 3600 جيجابايت/ثانية

عبر 32 وحدة DGX H100 (256 وحدة معالجة رسوميات H100)، مع نسبة تقارب 2:1:

إجمالي عرض النطاق الترددي = 256/2/2 * 900 جيجابايت/ثانية = 57600 جيجابايت/ثانية

بالمقارنة مع DGX A100، يوفر DGX H100 واحد زيادة بمقدار 1.5x في عرض النطاق الترددي وزيادة 3x في عرض النطاق الترددي ثنائي الاتجاه. باستخدام 32 جهاز DGX H100، يمكن تحسين عرض النطاق الترددي لكل حارة بمقدار 9x، ويمكن تحسين عرض النطاق الترددي ثنائي الاتجاه بمقدار 4.5x.

محرك التوصية العصبي

الملخص

في عصرنا الحالي الذي يعتمد على البيانات، يستمر الطلب على الحوسبة عالية الأداء في دفع الحدود التكنولوجية. تلعب تقنية NVSwitch من NVIDIA، والتي تعمل كجسر اتصال بين وحدات معالجة الرسومات، دورًا حاسمًا في بناء مجموعات حسابية فعالة. منذ بداية أول NVSwitch وحتى الابتكارات في الجيل الثالث، أصبح سعي NVIDIA الدؤوب لتحقيق الكفاءة الحسابية واضحًا. لا يعمل NVSwitch على تحسين عرض النطاق الترددي وسرعة نقل البيانات فحسب، بل يعزز أيضًا قدرات معالجة البيانات وأمن النظام من خلال وحدات SHARP وNVLink. ويتيح وجودها لأنظمة وحدات معالجة الرسومات المتعددة التعاون بشكل أكثر كفاءة، مما يوفر دعمًا قويًا لمجالات مثل الذكاء الاصطناعي والتعلم الآلي وتحليلات البيانات الضخمة. مع تقدم التكنولوجيا، ستظل NVSwitch محورية في مشهد الحوسبة عالية الأداء، مما يرمز إلى ابتكار NVIDIA ودفع تقدم الصناعة. بتوجيه من NVSwitch، نتوقع مستقبلًا أكثر ذكاءً وكفاءة وترابطًا.

اترك تعليق

انتقل إلى الأعلى