Введение
При работе с серверами NVIDIA H100 SXM вы часто можете увидеть конфигурацию, включающую два блока BFD-3. Это вызывает вопросы, особенно с учетом того, что система уже поставляется с восемью сетевыми картами CX-7 400G. Каковы принципиальные отличия и роли BFD-3 по сравнению с CX-7? Более того, почему у BFD есть порт BMC, если материнская плата сервера уже включает порт BMC?
Логическая связь между NIC, Smart NIC и DPU
Чтобы понять их различия, давайте сравним следующие моменты (личные мнения для справки):
Причины появления интеллектуальных сетевых карт и DPU
Эра традиционных сетевых карт
В традиционных центрах обработки данных центральный процессор был абсолютным ядром. Однако, поскольку закон Мура становится менее применимым, рост вычислительной мощности центрального процессора больше не может поспевать за взрывным ростом данных, создавая узкое место. Передача нагрузки центрального процессора на сетевые адаптеры (сетевые интерфейсные карты) стала необходимой, что привело к быстрому развитию интеллектуальных сетевых карт.
Эра интеллектуальных сетевых карт (первое поколение)
Первое поколение интеллектуальных сетевых карт в первую очередь было сосредоточено на разгрузке задач из плоскости данных. Примерами являются аппаратная разгрузка OVS Fastpath, аппаратная разгрузка сети RDMA на основе RoCEv1 и v2, аппаратная разгрузка для сетевых возможностей без потерь (PFC, ECN, ETS), аппаратная разгрузка NVMe-oF в домене хранения и разгрузка плоскости данных для безопасной передачи.
Эра интеллектуальных сетевых карт DPU (второе поколение)
Устройства обработки данных (DPU) появились для решения трех основных проблем в центрах обработки данных:
Между узлами: низкая эффективность обмена данными на сервере и ненадежная передача данных.
Внутри узлов: неэффективное выполнение модели центра обработки данных, низкая эффективность коммутатора ввода-вывода и негибкая архитектура сервера.
Сетевые системы: Небезопасные сети.
Упрощенное объяснение: почему DPU превосходят интеллектуальные сетевые карты
NVIDIA определяет интеллектуальные сетевые карты на базе DPU как сетевые интерфейсные карты, которые разгружают задачи, обычно выполняемые системным ЦП. Используя встроенный процессор, интеллектуальная сетевая карта на базе DPU может выполнять комбинацию задач шифрования/дешифрования, брандмауэра, TCP/IP и обработки HTTP. По сути, она помогает ЦП с различными задачами и имеет собственный ЦП для независимой обработки задач, связанных с сетевой безопасностью.
Обзор процессора обработки данных NVIDIA BlueField-3
Чтобы отреагировать на сдвиг в архитектуре ЦОД, вызванный технологией гипермасштабного облака, NVIDIA представила серию BlueField DPU. Эти новые процессоры разработаны специально для программного обеспечения инфраструктуры ЦОД, разгружая и ускоряя огромные вычислительные нагрузки, генерируемые виртуализацией, сетями, хранилищем, безопасностью и другими облачными службами искусственного интеллекта.
Системная компоновка NVIDIA BlueField-3 DPU
BlueField-3 функционирует как «независимый узел», интегрированный в PCIe-тракт сервера:
- ARM + OS: может разгрузить различные задачи, изначально выполняемые хостовой ОС.
- Интегрированные ускорители: повышают эффективность обработки, безопасности и хранения данных.
- Чип коммутатора PCIe: может использоваться в шкафах расширения NVMe SSD.
- Микросхема BMC: обеспечивает независимое управление исходными ресурсами хоста в облачной среде.
Рекомендуемые варианты использования BlueField-3
NVIDIA® BlueField®-3 DPU — это инфраструктурная вычислительная платформа третьего поколения, позволяющая предприятиям создавать программно-определяемую, аппаратно-ускоряемую ИТ-инфраструктуру от облака до основных центров обработки данных и периферийных сред. Благодаря сетевому подключению Ethernet 400 Гбит/с или NDR 400 Гбит/с InfiniBand, BlueField-3 DPU может разгружать, ускорять и изолировать программно-определяемые сетевые функции, функции хранения, безопасности и управления, значительно повышая производительность, эффективность и безопасность центра обработки данных.
Пример применения BlueField-3 в частном облаке VMware
Дорожная карта NVIDIA DPU
Понимая возможности и сферы применения процессора обработки данных BlueField-3, предприятия могут эффективно использовать эту технологию для удовлетворения потребностей современных центров обработки данных и обеспечения надежной, масштабируемой и безопасной инфраструктуры.