ومع تطور تقنيات الحوسبة السحابية والمحاكاة الافتراضية، تطورت أيضًا بطاقات الشبكة، ويمكن تقسيمها إلى أربع مراحل من حيث الوظيفة وبنية الأجهزة.
بطاقة الشبكة الأساسية التقليدية (NIC)
مسؤول عن نقل واستقبال حزم البيانات، مع قدرات أقل في تفريغ الأجهزة. تنفذ الأجهزة طبقة الارتباط الفيزيائي للشبكة ومعالجة الحزم بطبقة MAC باستخدام منطق أجهزة ASIC، كما تدعم بطاقات NIC القياسية اللاحقة أيضًا وظائف مثل فحص CRC. لا تحتوي على قدرات برمجة.
بطاقة الشبكة الذكية (SmartNIC)
تتمتع بقدرة معينة على تفريغ أجهزة مستوى البيانات، مثل تفريغ أجهزة OVS/vRouter. يستخدم هيكل الأجهزة FPGA أو معالجًا مدمجًا مع FPGA ونواة المعالج (هنا تكون وظيفة المعالج ضعيفة) لتحقيق تفريغ أجهزة مستوى البيانات.
وحدة معالجة البيانات المستندة إلى FPGA
هذه بطاقة شبكة ذكية تدعم تفريغ مستوى البيانات ومستوى التحكم، فضلاً عن درجة معينة من قابلية البرمجة لمستوى التحكم والبيانات. فيما يتعلق بتطوير بنية الأجهزة، فإنها تضيف معالج وحدة المعالجة المركزية للأغراض العامة استنادًا إلى FPGA، مثل وحدة المعالجة المركزية من Intel.
وحدة معالجة البيانات أحادية الشريحة
هذه شريحة DPU قابلة للبرمجة للأغراض العامة ذات شريحة واحدة، تتمتع بقدرات غنية في تسريع تفريغ الأجهزة وقابلية البرمجة، وتدعم سيناريوهات الحوسبة السحابية المختلفة وميزات إدارة الموارد الموحدة. من ناحية الأجهزة، تتبنى شكل SoC بشريحة واحدة، مما يوازن بين الأداء واستهلاك الطاقة. تأتي التحديات الرئيسية لـ DPU المستندة إلى FPGA في تصميم الأجهزة من مساحة الشريحة واستهلاك الطاقة. من حيث المساحة، يحد حجم هيكل واجهة PCIe من مساحة الشريحة على اللوحة؛ من حيث استهلاك الطاقة، يرتبط تصميم تبديد الحرارة للوحة ارتباطًا وثيقًا باستهلاك الطاقة للشريحة واللوحة بأكملها. يحد هذان العاملان من التطوير المستمر لحلول FPGA. يعتمد حل DPU SoC على خبرة وإنجازات البرامج والأجهزة من NIC إلى DPU المستندة إلى FPGA، وهو مسار تطور مهم لهندسة مركز البيانات التي تركز على DPU.
تعتمد وحدة DPU، باعتبارها ممثلًا نموذجيًا للرقائق المعرفة بالبرمجيات، على مفهوم "محددة بالبرمجيات، ومتسارعة بالأجهزة"، وهي معالج للأغراض العامة يدمج معالجة البيانات باعتبارها الوظيفة الأساسية على الشريحة. يتم استخدام وحدة المعالجة للأغراض العامة DPU للتعامل مع أعمال مستوى التحكم، وتضمن وحدة المعالجة المخصصة أداء معالجة مستوى البيانات، وبالتالي تحقيق التوازن بين الأداء والعمومية. يتم استخدام وحدة المعالجة المخصصة DPU لحل اختناق أداء المحاكاة الافتراضية للبنية التحتية العامة، وتضمن وحدة المعالجة للأغراض العامة عمومية DPU، مما يجعل DPU قابلة للتطبيق على نطاق واسع على سيناريوهات مختلفة للبنية التحتية السحابية، وتحقيق الانتقال السلس لإطار برامج المحاكاة الافتراضية إلى DPU.
تطوير وتطبيق NIC
بطاقة الشبكة الأساسية التقليدية NIC، والمعروفة أيضًا باسم محول الشبكة، هي جهاز الاتصال الأساسي والأكثر أهمية في نظام شبكة الكمبيوتر. وظيفتها الرئيسية هي تحويل البيانات التي يجب إرسالها إلى تنسيق يمكن لجهاز الشبكة التعرف عليه. مدفوعة بتطور تكنولوجيا الشبكة، فإن بطاقة الشبكة الأساسية التقليدية لديها أيضًا المزيد من الوظائف وكانت تمتلك في البداية بعض قدرات تفريغ الأجهزة البسيطة (مثل فحص CRC، وTSO/UF0، وLSO/LR0، وVLAN، وما إلى ذلك)، ودعم SR-IOV وإدارة حركة المرور QoS. كما تطور عرض النطاق الترددي لواجهة الشبكة لبطاقة الشبكة الأساسية التقليدية من 100M و1000M الأصلية إلى 10G و25G وحتى 100G.

في شبكة المحاكاة الافتراضية للحوسبة السحابية، توفر بطاقة الشبكة الأساسية التقليدية إمكانية الوصول إلى الشبكة إلى الجهاز الظاهري بثلاث طرق رئيسية.
(1) تستقبل بطاقة الشبكة حركة المرور وتعيد توجيهها إلى الجهاز الظاهري من خلال مكدس بروتوكول kernel لنظام التشغيل.
(2) يتولى برنامج تشغيل وضع المستخدم DPDK بطاقة الشبكة، مما يسمح لحزم البيانات بتجاوز مكدس بروتوكول kernel لنظام التشغيل والنسخ مباشرة إلى ذاكرة الجهاز الظاهري.
(3) باستخدام تقنية SR-IOV، يتم تحويل بطاقة الشبكة الفعلية PF إلى عدة VFs افتراضية مع وظائف بطاقة الشبكة، ثم يتم تمرير VF مباشرة إلى الجهاز الظاهري.
مع بروتوكولات النفق مثل VxLAN وتقنيات التبديل الافتراضية مثل OpenFlow و0VS وما إلى ذلك، يتزايد تعقيد معالجة الشبكة تدريجيًا، وهناك حاجة إلى المزيد من موارد وحدة المعالجة المركزية. ولذلك، ولدت SmartNIC.
تطوير وتطبيق SmartNIC
بالإضافة إلى امتلاك SmartNIC لوظيفة نقل الشبكة الخاصة ببطاقة الشبكة الأساسية التقليدية، فإنه يوفر أيضًا قدرات تسريع تفريغ الأجهزة الغنية، والتي يمكنها تحسين معدل إعادة توجيه شبكة الحوسبة السحابية وتحرير موارد الحوسبة لوحدة المعالجة المركزية المضيفة.

لا يحتوي SmartNIC على وحدة معالجة مركزية عامة الغرض، ويحتاج إلى وحدة المعالجة المركزية المضيفة لإدارة مستوى التحكم. إن كائن تسريع التفريغ الرئيسي لـ SmartNIC هو مستوى البيانات، مثل تفريغ Fastpath لمستوى البيانات للمفاتيح الافتراضية 0VS/vRouter، وتفريغ شبكة RDMA، وتفريغ تخزين NVMe-oF، وتفريغ أمان مستوى بيانات IPsec/TLS، وما إلى ذلك.
ومع ذلك، مع استمرار زيادة سرعة الشبكة في تطبيقات الحوسبة السحابية، لا يزال المضيف يستهلك الكثير من موارد وحدة المعالجة المركزية القيمة لتصنيف حركة المرور وتتبعها والتحكم فيها. أصبحت كيفية تحقيق "الاستهلاك الصفري" لوحدة المعالجة المركزية المضيفة هي الاتجاه البحثي التالي لموردي الخدمات السحابية.
تطوير وتطبيق DPU القائم على FPGA
بالمقارنة مع SmartNIC، يضيف DPU المستند إلى FPGA وحدة معالجة CPU عامة الغرض إلى بنية الأجهزة، مما يشكل بنية FPGA+CPU، مما يسهل تسريع وتفريغ البنية الأساسية العامة مثل الشبكة والتخزين والأمان والإدارة. في هذه المرحلة، يكون شكل المنتج من DPU هو FPGA+CPU بشكل أساسي. تتمتع DPU المستندة إلى بنية الأجهزة FPGA+CPU بقدرة جيدة على برمجة البرامج والأجهزة.

في المرحلة المبكرة من تطوير DPU، اختارت معظم الشركات المصنعة لـ DPU هذا المخطط. يتمتع هذا المخطط بوقت تطوير قصير نسبيًا وتكرار سريع، ويمكنه إكمال تطوير الوظائف المخصصة بسرعة، وهو مناسب لمصنعي DPU لإطلاق المنتجات بسرعة والاستيلاء على السوق. ومع ذلك، مع ترحيل النطاق الترددي للشبكة من 25 جيجا إلى 100 جيجا، فإن وحدة المعالجة المركزية (DPU) المستندة إلى بنية أجهزة FPGA+CPU محدودة بعملية الشريحة وبنية FPGA، مما يجعل من الصعب تحقيق تحكم جيد في منطقة الشريحة واستهلاك الطاقة عند السعي لتحقيق إنتاجية أعلى. ، مما يحد من التطوير المستمر لبنية DPU هذه.
تطوير وتطبيق DPU SoC NIC
DPU SoC عبارة عن بنية أجهزة تعتمد على ASIC، والتي تجمع بين مزايا ASIC ووحدة المعالجة المركزية وتوازن بين الأداء الممتاز للمسرعات المخصصة والمرونة القابلة للبرمجة للمعالجات ذات الأغراض العامة. إنه حل تكنولوجيا DPU أحادي الشريحة الذي يدفع تطوير تكنولوجيا الحوسبة السحابية.
كما ذكرنا في الفقرة السابقة، على الرغم من أن DPU تلعب دورًا مهمًا في الحوسبة السحابية، إلا أن حلول DPU التقليدية يتم تقديمها في الغالب في المخططات المستندة إلى FPGA. مع ترحيل الخادم من 25G إلى خادم 100G من الجيل التالي، تواجه التكلفة واستهلاك الطاقة والوظائف والجوانب الأخرى تحديات خطيرة. لا تتمتع شريحة DPU SoC أحادية الشريحة بمزايا هائلة من حيث التكلفة واستهلاك الطاقة فحسب، بل تتمتع أيضًا بإنتاجية عالية وقدرات برمجة مرنة. وهو لا يدعم فقط إدارة التطبيقات ونشر الأجهزة والحاويات الافتراضية، بل يدعم أيضًا التطبيقات المعدنية.

مع التطوير المستمر لتقنية DPU، أصبحت DPU SoC القابلة للبرمجة للأغراض العامة مكونًا رئيسيًا في بناء مراكز البيانات لموردي الخدمات السحابية. يمكن لـ DPU SoC تحقيق إدارة اقتصادية وفعالة لموارد الحوسبة وموارد الشبكة في مركز البيانات. يمكن لوحدة DPU SoC ذات الوظائف الغنية والإمكانيات القابلة للبرمجة أن تدعم سيناريوهات الحوسبة السحابية المختلفة وإدارة الموارد الموحدة، وتحسين استخدام موارد الحوسبة في مركز البيانات.
في تصميم وتطوير واستخدام DPU، استثمر عمالقة الرقائق ومقدمو الخدمات السحابية الرائدون في الداخل والخارج الكثير من موارد البحث والتطوير، وحققوا فعالية جيدة من حيث التكلفة من خلال الاستكشاف والممارسة المستمرين.
DPU في AWS (Amazon Cloud)
AWS هي الشركة الرائدة عالميًا في مجال توفير خدمات الحوسبة السحابية وحلولها. أصبح نظام AWS Nitro DPU حجر الزاوية الفني لخدمة AWS السحابية. تستخدم AWS نظام Nitro DPU لتحليل ونقل وظائف الشبكة والتخزين والأمن والمراقبة إلى أجهزة وبرامج مخصصة، وتوفر جميع الموارد تقريبًا على الخادم لمثيلات الخدمة، مما يقلل التكاليف بشكل كبير. يمكن لتطبيق Nitro DPU في Amazon Cloud أن يجعل الخادم يكسب آلاف الدولارات سنويًا. يتكون نظام Nitro DPU بشكل أساسي من الأجزاء التالية.

(1) بطاقة نيترو. سلسلة من الأجهزة المخصصة للشبكة والتخزين والتحكم لتحسين الأداء العام للنظام.
(2) شريحة أمان نيترو. قم بنقل وظائف المحاكاة الافتراضية والأمان إلى أجهزة وبرامج مخصصة، وتقليل سطح الهجوم، وتحقيق نظام أساسي سحابي آمن.
(3) برنامج مراقبة نيترو. برنامج إدارة Hypervisor خفيف الوزن يمكنه إدارة الذاكرة وتخصيص وحدة المعالجة المركزية، وتوفير أداء لا يمكن تمييزه عن الأداء العادي.
يوفر نظام Nitro DPU وظائف المفاتيح والشبكة والأمان والخادم والمراقبة، ويطلق موارد الخدمة الأساسية للأجهزة الافتراضية للعملاء، ويمكّن AWS من توفير المزيد من أنواع المثيلات المعدنية، بل وحتى زيادة أداء الشبكة لمثيلات محددة 100Gbps.
نفيديا دي بي يو
NVIDIA هي شركة لأشباه الموصلات تعمل بشكل أساسي على تصميم وبيع وحدات معالجة الرسومات (GPUs)، المستخدمة على نطاق واسع في مجالات الذكاء الاصطناعي والحوسبة عالية الأداء (HPC). في أبريل 2020، استحوذت NVIDIA على شركة Mellanox، وهي شركة متخصصة في شرائح وأجهزة الشبكات، مقابل 6.9 مليار دولار، ثم أطلقت سلسلة BlueField من وحدات DPU.
ترث NVIDIA BlueField-3 DPU (كما هو موضح في الشكل 7) الميزات المتقدمة لـ BlueField-2 DPU وهي أول وحدة DPU مصممة للذكاء الاصطناعي والحوسبة المتسارعة. يوفر BlueField-3 DPU ما يصل إلى شبكة 400 جيجابت في الثانية الاتصال ويمكنه تفريغ وتسريع وعزل، ودعم وظائف الشبكة والتخزين والأمان والإدارة المحددة بالبرمجيات.
إنتل الاتحاد البرلماني الدولي
Intel IPU هو جهاز شبكة متقدم مزود بمسرعات قوية واتصالات إيثرنت، ويمكنه استخدام نوى مخصصة قابلة للبرمجة ومقترنة بإحكام لتسريع وإدارة وظائف البنية الأساسية. يوفر IPU تفريغًا كاملاً للبنية الأساسية، ويعمل كنقطة تحكم مضيفة لتشغيل تطبيقات البنية الأساسية، مما يوفر طبقة إضافية من الأمان. باستخدام Intel IPU، يمكن تفريغ جميع خدمات البنية الأساسية من الخادم إلى IPU، مما يحرر موارد وحدة المعالجة المركزية للخادم، كما يوفر لمقدمي الخدمات السحابية نقطة تحكم مستقلة وآمنة.

في عام 2021، أعلنت إنتل عن منتجات Oak Springs Canyon وMount Evans IPU في يوم Intel Architecture Day. من بينها، Oak Springs Canyon هو منتج IPU قائم على FPGA، وMount Evans IPU هو منتج IPU قائم على ASIC.
تم تجهيز Intel Oak Springs Canyon IPU بوحدة المعالجة المركزية Intel Agilex FPGA وXeon-D. Intel Mount Evans IPU عبارة عن SoC (System-on-a-Chip) تم تصميمه بشكل مشترك بين Intel وGoogle. ينقسم Mount Evans بشكل أساسي إلى قسمين: النظام الفرعي I0 والنظام الفرعي للحوسبة. يستخدم جزء الشبكة ASIC لمعالجة الحزم، والذي يتميز بأداء أعلى بكثير واستهلاك أقل للطاقة من FPGA. يستخدم النظام الفرعي للحوسبة 16 نواة ARM Neoverse N1، والتي تتمتع بقدرات حوسبة قوية للغاية.
DPU في علي بابا كلاود
كما تستكشف Alibaba Cloud باستمرار تقنية DPU. في مؤتمر Alibaba Cloud Summit في عام 2022، أصدرت Alibaba Cloud رسميًا معالج البنية التحتية السحابية CIPU، والذي يعتمد على بنية Shenlong. سلف CIPU هو بطاقة MoC (Micro Server on a Card)، والتي تلبي تعريف DPU من حيث الوظيفة والموقع. تحتوي بطاقة MoC على وحدات I0 وتخزين ومعالجة مستقلة، وتتولى أعمال الشبكة والتخزين والمحاكاة الافتراضية للجهاز. حلت بطاقات MoC من الجيل الأول والثاني المعنى الضيق لمشاكل الحوسبة الافتراضية بدون تكاليف إضافية، ولا يزال البرنامج ينفذ جزء الشبكة والتخزين من المحاكاة الافتراضية. تحقق بطاقة MoC من الجيل الثالث تقوية بعض وظائف إعادة توجيه الشبكة، ويتم تحسين أداء الشبكة بشكل كبير. تحقق بطاقة MoC من الجيل الرابع تفريغ الأجهزة بالكامل من الشبكة والتخزين وتدعم أيضًا إمكانية RDMA.
باعتباره نظام معالج مركز بيانات مصممًا لنظام Feitian، فإن Alibaba Cloud CIPU له معنى كبير لـ Alibaba Cloud لبناء جيل جديد من أنظمة هندسة الحوسبة السحابية الكاملة للبرامج والأجهزة.
DPU في محرك البركان
كما يستكشف Volcano Engine باستمرار طريق DPU الذي تم تطويره ذاتيًا. يعتمد DPU الذي تم تطويره ذاتيًا على تقنية المحاكاة الافتراضية المتكاملة الناعمة والصعبة، بهدف تزويد المستخدمين بخدمات الحوسبة عالية الأداء المرنة والقابلة للتطوير. في منتجات الحوسبة المرنة من Volcano Engine، تم تجهيز خادم المعدن العاري المرن من الجيل الثاني وخادم السحابة من الجيل الثالث بوحدات DPU التي تم تطويرها ذاتيًا، والتي تم التحقق منها على نطاق واسع في قدرات المنتج وسيناريوهات التطبيق. كانت نسخة EBM من الجيل الثاني من Volcano Engine، والتي تم تسويقها رسميًا في عام 2022، أول من حمل DPU التي تم تطويرها ذاتيًا من Volcano Engine. إنه لا يحتفظ بمزايا الاستقرار والأمان للآلات المادية التقليدية فحسب، بل يمكنه تحقيق عزل مادي آمن، ولكنه يتمتع أيضًا بمزايا المرونة والمرونة للآلات الافتراضية. إنه جيل جديد من خوادم السحابة عالية الأداء مع مزايا متعددة. تم إصدار نسخة ECS من الجيل الثالث من Volcano Engine في النصف الأول من عام 2023، كما تجمع بين بنية أحدث وحدة معالجة مركزية (DPU) مطورة ذاتيًا من Volcano Engine وتقنية التبديل الافتراضي والافتراضية المطورة ذاتيًا، وتم تحسين أداء الشبكة والتخزين IO بشكل كبير.
المنتجات ذات الصلة:
-
وحدة إرسال واستقبال بصرية متوافقة مع NVIDIA MMA1Z00-NS400، 400 جيجابايت، QSFP112 VR4 PAM4، 850 نانومتر، 50 مترًا، MTP/MPO-12 OM4 FEC $550.00
-
QSFP-DD-400G-SR4 QSFP-DD 400G SR4 PAM4 850nm 100m MTP/MPO-12 OM4 FEC وحدة الإرسال والاستقبال الضوئية $450.00
-
NVIDIA MMA4Z00-NS400 متوافق مع 400G OSFP SR4 مسطح علوي PAM4 850 نانومتر 30 متر على OM3 / 50m على وحدة الإرسال والاستقبال البصرية OM4 MTP / MPO-12 Multimode FEC $550.00
-
NVIDIA MMA4Z00-NS-FLT متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال البصرية $650.00
-
NVIDIA MMA4Z00-NS متوافق مع 800Gb / s ثنائي المنافذ OSFP 2x400G SR8 PAM4 850nm 100m DOM Dual MPO-12 MMF وحدة الإرسال والاستقبال الضوئية $650.00
-
NVIDIA MMS4X00-NM متوافق مع 800Gb / s ثنائي المنفذ OSFP 2x400G PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $900.00
-
NVIDIA MMS4X00-NM-FLT متوافق مع 800G Twin-port OSFP 2x400G Flat Top PAM4 1310nm 500m DOM Dual MTP / MPO-12 SMF وحدة الإرسال والاستقبال البصرية $1199.00
-
NVIDIA MMS4X00-NS400 متوافق 400G OSFP DR4 Flat Top PAM4 1310nm MTP / MPO-12m SMF FEC وحدة الإرسال والاستقبال البصرية $700.00
-
NVIDIA MCP7Y10-N003 متوافق مع 3 متر (10 قدم) 800 جيجا InfiniBand NDR ثنائي المنفذ OSFP إلى 2x400 جيجا QSFP112 Breakout DAC $245.00
-
NVIDIA MCA7J65-N005 متوافق مع 5m (16ft) 800G ثنائي المنفذ OSFP إلى 2x400G QSFP112 InfiniBand NDR Breakout Active Copper Cable $850.00