العلاقة بين المفاتيح والذكاء الاصطناعي

بروتوكول الشبكة هو مجموعة من القواعد أو المعايير أو الاتفاقيات الموضوعة لتبادل البيانات في شبكة الكمبيوتر. وعلى المستوى القانوني، يعتبر بروتوكول OSI المكون من سبع طبقات بروتوكولاً دولياً.

نظرًا لمتطلبات الحوسبة عالية الأداء/الذكاء الاصطناعي فيما يتعلق بمعدل نقل البيانات العالي وزمن الوصول المنخفض، فإن بروتوكول TCP/IP ينتقل تدريجيًا إلى تقنية RDMA في مراكز البيانات. تحتوي تقنية RDMA على فروع مختلفة. من بينها، تم تصميم Infiniband خصيصًا لتقنية RDMA، والتي تضمن نقلًا موثوقًا به من مستوى الأجهزة. تتمتع بتقنية متقدمة ولكنها باهظة الثمن. تعتمد كل من RoCE وiWARP على تقنية Ethernet RDMA.

ترتكز هذه المقالة على الجوانب التالية لمناقشة العلاقة بين المفاتيح والذكاء الاصطناعي.

س: ما هو البروتوكول؟

س: ما هو دور المفاتيح في بنية مركز البيانات؟

س: مفتاح NVIDIA = مفتاح IB؟

س: كيف أفهم NVIDIA SuperPOD؟

س: ما هو الوضع الراهن لسوق التبديل؟

ما هو البروتوكول؟

بروتوكول الشبكة هو مجموعة من القواعد أو المعايير أو الاتفاقيات الموضوعة لتبادل البيانات في شبكة الكمبيوتر. وعلى المستوى القانوني، يعد بروتوكول OSI ذي السبع طبقات بروتوكولاً دولياً. وفي ثمانينيات القرن العشرين، من أجل توحيد أساليب الاتصال بين أجهزة الكمبيوتر وتلبية احتياجات الشبكات المفتوحة، تم اقتراح بروتوكول OSI (Open System Interconnection)، والذي تبنى شبكة ذات سبع طبقات.

  • الطبقة المادية: تحل كيفية تواصل الأجهزة مع بعضها البعض. وتتمثل وظيفتها الرئيسية في تحديد معايير الأجهزة المادية (مثل نوع الواجهة ومعدل الإرسال وما إلى ذلك) لتحقيق نقل تدفقات البتات (تدفق البيانات الذي يتم تمثيله بالرقمين 0 و1).
  • طبقة ارتباط البيانات: الوظائف الرئيسية هي ترميز الإطارات والتحكم في تصحيح الأخطاء. العمل المحدد هو تلقي البيانات من الطبقة المادية وتغليفها في إطارات ثم إرسالها إلى الطبقة العليا. وبالمثل، يمكن تقسيم البيانات من طبقة الشبكة إلى تدفقات بت ونقلها إلى الطبقة المادية. يمكن تحقيق وظيفة تصحيح الأخطاء لأن كل إطار يتضمن معلومات التحقق بالإضافة إلى البيانات المراد نقلها.
  • طبقة الشبكة: تقوم بإنشاء دوائر منطقية بين العقد وتجد العناوين من خلال IP (لكل عقدة في الشبكة عنوان IP). البيانات المنقولة في هذه الطبقة تكون في شكل حزم.
  • طبقة النقل: مسؤولة عن مراقبة جودة نقل البيانات. في حالة حدوث فقدان للحزمة، يجب إعادة إرسالها.
  • طبقة الجلسة: وظيفتها الأساسية هي إدارة اتصالات الجلسة لأجهزة الشبكة.
  • طبقة العرض: المسؤولة بشكل أساسي عن تحويل تنسيق البيانات والتشفير وما إلى ذلك.
  • طبقة التطبيق: توفر واجهات التطبيق، التي يمكنها توفير خدمات الشبكة المختلفة للمستخدمين بشكل مباشر واستكمال مهام الشبكة المختلفة.

تتضمن مجموعة بروتوكولات TCP/IP بروتوكولات مختلفة. ويمكن تقسيم هذه البروتوكولات تقريبًا إلى أربع طبقات، وهي طبقة التطبيق وطبقة النقل وطبقة الشبكة وطبقة ارتباط البيانات. في الواقع، يمكن فهم بروتوكول TCP/IP باعتباره نسخة محسنة من بروتوكول OSI ذي السبع طبقات.

مقارنة بين نموذج الشبكة OSI المكون من سبع طبقات ونموذج TCP/IP المكون من أربع طبقات

مقارنة بين نموذج الشبكة OSI المكون من سبع طبقات ونموذج TCP/IP المكون من أربع طبقات

نظرًا لمتطلبات الحوسبة عالية الأداء فيما يتعلق بمعدل نقل البيانات العالي وزمن الوصول المنخفض، فإن بروتوكول TCP/IP يتحول تدريجيًا إلى RDMA. هناك العديد من العيوب الرئيسية لبروتوكول TCP/IP:

أولاً، هناك زمن انتقال يصل إلى عشرات الميكروثانية. ونظرًا لأن مجموعة بروتوكولات TCP/IP تتطلب تبديلات سياقية متعددة أثناء النقل وتعتمد على وحدة المعالجة المركزية للتغليف، فإن زمن الانتقال طويل نسبيًا.

ثانيًا، يتم تحميل وحدة المعالجة المركزية بشكل كبير. تتطلب شبكة TCP/IP من وحدة المعالجة المركزية المضيفة المشاركة في نسخ ذاكرة مكدس البروتوكول عدة مرات، ومعامل الارتباط بين تحميل وحدة المعالجة المركزية وعرض النطاق الترددي للشبكة كبير جدًا.

RDMA (Remote Direct Memory Access): يمكن الوصول إلى بيانات الذاكرة مباشرة من خلال واجهة الشبكة دون تدخل نواة نظام التشغيل. وهذا يسمح باتصالات شبكية عالية الإنتاجية ومنخفضة التأخير، وهو مناسب بشكل خاص للاستخدام في مجموعات الكمبيوتر المتوازية الضخمة.

ثلاثة أوضاع لـRDMA

لا يحدد RDMA مجموعة البروتوكولات بالكامل، ولكنه يفرض متطلبات عالية على عمليات الإرسال المحددة: على سبيل المثال، عدم الخسارة، والإنتاجية العالية، وزمن الوصول المنخفض، وما إلى ذلك. يتضمن RDMA فروعًا مختلفة، من بينها Infiniband المصمم خصيصًا لـ RDMA ويضمن إرسالًا موثوقًا به على مستوى الأجهزة. إنه متقدم تقنيًا ولكنه مكلف. يعتمد كل من RoCE وiWARP على تقنية Ethernet RDMA.

ما هو دور المحولات في بنية مركز البيانات؟

تعمل المفاتيح والموجهات على مستويات مختلفة. يعمل المحول في طبقة ارتباط البيانات ويمكنه تغليف حزم البيانات وإعادة توجيهها بناءً على تحديد MAC (عنوان الأجهزة لبطاقة الشبكة)، مما يسمح للأجهزة المختلفة بالتواصل مع بعضها البعض. يعمل الموجه، المعروف أيضًا باسم محدد المسار، في طبقة الشبكة لتحقيق الترابط، وتنفيذ التوجيه بناءً على IP، وربط الشبكات الفرعية المختلفة.

غالبًا ما تستخدم مراكز البيانات التقليدية بنية ثلاثية الطبقات، وهي طبقة الوصول وطبقة التجميع والطبقة الأساسية. ومع ذلك، في مراكز البيانات الصغيرة، يمكن تجاهل وجود طبقة التجميع. من بينها، عادةً ما تكون طبقة الوصول متصلة مباشرة بالخادم، حيث يكون مفتاح TOR (Top of Rack) هو الأكثر استخدامًا. تعد طبقة التجميع "الطبقة الوسيطة (الطبقة الوسطى)" بين طبقة الوصول إلى الشبكة والطبقة الأساسية. توفر مفاتيح النواة إعادة التوجيه للحزم الداخلة والخارجة من مركز البيانات وتوفر الاتصال لطبقة التجميع.

مع تطور الحوسبة السحابية، أصبحت عيوب الشبكات التقليدية ثلاثية الطبقات أكثر وضوحًا:

  • إهدار النطاق الترددي: تدير كل مجموعة من مفاتيح التجميع نقطة تسليم (POD)، ولكل نقطة تسليم شبكة VLAN مستقلة. يُستخدم بروتوكول الشجرة الممتدة (STP) عادةً بين مفاتيح التجميع ومفاتيح الوصول. يجعل بروتوكول الشجرة الممتدة مفتاح طبقة تجميع واحدًا متاحًا لشبكة VLAN، مع حظر طبقات التجميع الأخرى. وهذا يجعل أيضًا من المستحيل توسيع طبقة التجميع أفقيًا.
  • مجال خطأ كبير: بسبب خوارزمية STP، يلزم إعادة التقارب عندما تتغير طوبولوجيا الشبكة، والتي تكون عرضة للفشل.
  • زمن انتقال طويل: مع تطور مراكز البيانات، زادت حركة المرور من الشرق إلى الغرب بشكل كبير، ويحتاج الاتصال بين الخوادم في البنية ثلاثية الطبقات إلى المرور عبر المفاتيح طبقة تلو الأخرى، مما يؤدي إلى زمن انتقال طويل. بالإضافة إلى ذلك، يستمر ضغط العمل على المفاتيح الأساسية ومفاتيح التجميع في الزيادة، كما تتسبب ترقيات الأداء في ارتفاع التكاليف.

تتمتع بنية الورقة والعمود الفقري بمزايا واضحة، بما في ذلك التصميم المسطح، وزمن الوصول المنخفض، وعرض النطاق الترددي العالي. تعمل شبكة الورقة والعمود الفقري على تسطيح الشبكة، حيث تكون مفاتيح الورقة مكافئة لمفاتيح طبقة الوصول التقليدية ومفاتيح العمود الفقري مماثلة لمفاتيح النواة.

يتم تحديد مسارات متعددة بشكل ديناميكي بين مفاتيح الأوراق والعمود الفقري من خلال ECMP (مسارات متعددة متساوية التكلفة). عندما لا توجد اختناقات في منافذ الوصول والروابط الصاعدة لطبقة الأوراق، فإن هذه البنية تحقق عدم الحظر. نظرًا لأن كل ورقة في النسيج متصلة بكل عمود فقري، فإذا فشل عمود فقري، فسوف يتدهور أداء معدل نقل البيانات في مركز البيانات بشكل طفيف فقط.

مفتاح NVIDIA = مفتاح IB؟

لا. تم تجهيز منصات NVIDIA Spectrum وQuantum بمفاتيح Ethernet وIB.

يتم تشغيل مفاتيح IB بشكل أساسي بواسطة الشركة المصنعة mellanox، والتي استحوذت عليها NVIDIA بنجاح في عام 2020. بالإضافة إلى ذلك، تعتمد مفاتيح منصة Spectrum من NVIDIA بشكل أساسي على Ethernet، وتتجدد منتجاتها باستمرار. يعد Spectrum-4 الذي تم إصداره في عام 2022 منتجًا لمفاتيح 400G.

منصات NVIDIA Spectrum وQuantum

تم تصميم Spectrum-X للذكاء الاصطناعي التوليدي وتحسين قيود مفاتيح Ethernet التقليدية. هناك عنصران رئيسيان في منصة NVIDIA Spectrum X وهما مفتاح Ethernet NVIDIA Spectrum-4 ووحدة معالجة الرسومات NVIDIA BlueField-3.

تتضمن المزايا الرئيسية لـ Spectrum-X ما يلي: توسيع نطاق RoCE للذكاء الاصطناعي والتوجيه التكيفي (AR) لتحقيق أقصى أداء لمكتبة NVIDIA Collective Communications Library (NCCL). يمكن لـ NVIDIA Spectrum-X تحقيق نطاق ترددي فعال يصل إلى 95% عند تحميل ونطاق أنظمة Hyperscale.

  • استفد من عزل الأداء للتأكد من أنه في بيئة متعددة المستأجرين ومتعددة الوظائف، لا تؤثر وظيفة واحدة على وظيفة أخرى.
  • تأكد من أن البنية التحتية للشبكة تستمر في تقديم الأداء الأقصى في حالة فشل أحد مكونات الشبكة.
  • قم بالمزامنة مع BlueField-3 DPU للحصول على أداء NCCL وAI الأمثل.
  • الحفاظ على أداء ثابت ومستقر عبر مجموعة متنوعة من أحمال عمل الذكاء الاصطناعي، وهو أمر بالغ الأهمية لتحقيق اتفاقيات مستوى الخدمة.

في وضع الشبكات، يعد IB أو Ethernet سؤالاً مهمًا. في السوق الحالية، تحتل Ethernet الغالبية العظمى من حصة السوق، ولكن في بعض سيناريوهات الحوسبة واسعة النطاق، تبرز IB. في مؤتمر الحوسبة الفائقة ISC 2021، شكلت IB 70% من أنظمة TOP10 و65% من أنظمة TOP100. ومع نمو نطاق الاعتبار، تنخفض حصة IB في السوق.

تستهدف منصتي Spectrum وQuantum سيناريوهات تطبيق مختلفة. وفي رؤية Nvidia، يمكن تقسيم سيناريوهات تطبيق الذكاء الاصطناعي تقريبًا إلى سحابة الذكاء الاصطناعي ومصنع الذكاء الاصطناعي. ويمكن استخدام مفاتيح Ethernet التقليدية وSpectrum-X Ethernet في سحابة الذكاء الاصطناعي، بينما تكون حلول NVLink+InfiniBand مطلوبة في مصنع الذكاء الاصطناعي.

كيفية فهم NVIDIA SuperPOD؟

SuperPOD عبارة عن مجموعة خوادم تربط بين عدة عقد حوسبة لتوفير أداء إنتاجي أكبر.

باستخدام NVIDIA DGX A100 SuperPOD كمثال، فإن المفتاح المستخدم في التكوين الموصى به رسميًا بواسطة NVIDIA هو QM9700، والتي يمكن أن توفر 40 منفذ 200G. في الطبقة الأولى، يحتوي خادم DGX A100 على إجمالي 8 واجهات، متصلة بـ 8 مفاتيح ورقية على التوالي لأنه يعتمد على بنية شجرة سميكة (غير متقاربة). يشكل 20 خادمًا وحدة SU، لذلك يلزم إجمالي 8 خوادم SU*. في بنية الطبقة الثانية، نظرًا لأن الشبكة لا تتقارب وسرعة المنفذ متسقة، يجب أن يكون منفذ الارتباط الصاعد الذي يوفره مفتاح العمود الفقري أكبر من أو يساوي منفذ الارتباط الهابط لمفتاح الورقة. لذلك، تتوافق وحدة SU واحدة مع 1 مفاتيح ورقية و8 مفاتيح عمود فقري، وتتوافق وحدتا SU مع 5 مفتاحًا ورقيًا و2 مفاتيح عمود فقري، وهكذا. بالإضافة إلى ذلك، عندما يزيد عدد وحدات SU إلى أكثر من 16، فإن التوصية الرسمية هي إضافة مفتاح طبقة أساسية.

مرجع هندسة NVIDIA DGX A100 SuperPOD

في DGX A100 SuperPOD، تكون نسبة الخادم: المحول في شبكة الحوسبة 1:1.17 (مع أخذ 7 وحدات تخزين كمثال)؛ ولكن في DGX A100 SuperPOD، تكون النسبة 1:0.38. مع الأخذ في الاعتبار متطلبات التخزين وإدارة الشبكة، تكون نسبة الخادم: المحول في DGX A100 SuperPOD وDGX H100 SuperPOD 1:1.34 و1:0.50 على التوالي.

من حيث المنافذ، في التكوين الموصى به لـ DGX H100، تتكون كل وحدة SU من 31 خادمًا. من ناحية، يحتوي DGX H100 على 4 واجهات فقط للحوسبة، ومن ناحية أخرى، فإن المحول هو QM9700، مما يوفر 64 منفذًا بسعة 400 جيجابايت في DGX H100 SuperPOD.

من حيث أداء المحول، تم تحسين أداء QM9700 بشكل كبير في التكوين الموصى به لـ DGX H100 SuperPOD. تقدم محولات Infiniband تقنية Sharp. من خلال إنشاء شجرة تجميع متدفقة (SAT) في الطوبولوجيا المادية من خلال مدير التجميع، ثم جعل محولات متعددة في الشجرة تؤدي عمليات متوازية، يمكن تقليل زمن الوصول بشكل كبير وتحسين أداء الشبكة. يدعم QM8700/8790+CX6 ما يصل إلى 2 SAT فقط، لكن QM9700/9790+CX7 يدعم ما يصل إلى 64. يزداد عدد منافذ التكديس، وبالتالي ينخفض ​​عدد المحولات المستخدمة.

وبالنظر إلى أسعار التبديل، فإن سعر QM9700 هو ضعف سعر QM8700/8790 تقريبًا. ووفقًا للموقع الرسمي لشركة SHI، فإن سعر وحدة Quantum-2 QM9700 هو 38,000 دولار أمريكي، وسعر وحدة Quantum QM8700/8790 هو 23,000/17,000 دولار أمريكي على التوالي.

ما هو الوضع الراهن لسوق التبديل؟

يشهد سوق المفاتيح ازدهارًا على المدى القصير. ومع تطور الذكاء الاصطناعي، من المتوقع أن يتوسع الطلب في السوق بشكل أكبر ويظهر اتجاهًا نحو التكرارات عالية الجودة.

من منظور هيكلي، لا يزال سوق التبديل بمثابة محيط أزرق، حيث تستحوذ شركة Cisco على حصة كبيرة، وتنمو شركة Arista بسرعة.

من حيث حجم السوق: في الربع الأول من عام 1، بلغت إيرادات محولات إيثرنت العالمية 2023 مليار دولار أمريكي، بزيادة سنوية قدرها 10.021%. وزادت إيرادات محولات 31.5 جيجابت/200 جيجابت بنسبة 400% على أساس سنوي، وزادت إيرادات محولات 41.3 جيجابت بنسبة 100% على أساس سنوي.

من حيث كمية شحن الموانئ: تم شحن 229 مليون وحدة في الربع الأول من عام 2023، بزيادة سنوية قدرها 14.8%. وزادت منافذ 200 جيجابايت/400 جيجابايت و100 جيجابايت بنسبة 224.2% و17.0% على التوالي.

إن المنافسة في سوق المحولات أفضل من المنافسة في سوق الخوادم. ووفقًا لـ NextPlatform، استحوذت شركة Cisco على 46% من حصة السوق في الربع الأول من عام 1، أي ما يقرب من 2023 مليار دولار أمريكي، بزيادة سنوية قدرها 4.61%. حققت شركة Arista إيرادات بلغت 33.7 مليار دولار أمريكي في الربع الأول من عام 1.15، بزيادة سنوية قدرها 2023%، وذلك بفضل أدائها المتميز في مركز البيانات.

من حيث الربحية، تتمتع كل من Cisco وArista بهامش ربح إجمالي يقترب من 60%. وقد أدى المشهد المواتي نسبيًا إلى خلق ربحية جيدة للشركات المصنعة في سلسلة الصناعة. وعلى الرغم من أن هوامش الربح الإجمالية لشركتي Cisco وArista أظهرت اتجاهًا هبوطيًا طفيفًا، إلا أنهما لا تزالان تحافظان على هامش ربح إجمالي يبلغ حوالي 60% بشكل عام. وبالنظر إلى المستقبل، نعتقد أن سوق المحولات من المتوقع أن تستمر في الاستفادة من تطوير الذكاء الاصطناعي.

اترك تعليق

انتقل إلى الأعلى