Обзор NVIDIA HGX B300

Платформа NVIDIA HGX B300 представляет собой значительный шаг вперед в нашей вычислительной инфраструктуре. Примечательно, что последний вариант, обозначенный как NVIDIA HGX B300 NVL16, указывает количество вычислительных чипов, соединенных через NVLink, а не просто отражает количество пакетов GPU. Это изменение номенклатуры подчеркивает эволюционирующий подход NVIDIA к производительности соединений и модульной масштабируемости.

Обзор NVIDIA HGX B300

Характеристики

В следующей таблице приведены основные технические характеристики HGX B300 NVL16 и более ранних вариантов HGX B200:

СпецификацияHGX B300 NVL16ХГХ B200
Форм-фактор16 × графических процессоров NVIDIA Blackwell Ultra8 × графических процессоров NVIDIA Blackwell
Тензорное ядро ​​FP4**144 PFLOPS (с разреженностью) 144 ПФЛОПС (без разреженности)105 PFLOPS (с разреженностью) 72 ПФЛОПС (без разреженности)
Ядро тензора FP8/FP6*72 пфлопс72 пфлопс
Тензорное ядро ​​INT8*2 ПОПС72 ПОПС
Тензорное ядро ​​FP16/BF16*36 пфлопс36 пфлопс
Тензорное ядро ​​TF32*18 пфлопс18 пфлопс
FP32 Производительность600 TFLOPS600 TFLOPS
Ядро тензора FP64/FP6410 TFLOPS296 TFLOPS
Общая памятьДо 2.3 TB1.4 ТБ
Генерация NVLinkПятое поколениеПятое поколение
NVIDIA NVSwitch™Коммутатор NVLink 5Коммутатор NVLink 5
Пропускная способность NVSwitch GPU-GPU1.8 TB / s1.8 TB / s
Общая пропускная способность NVLink14.4 TB / s14.4 TB / s
Пропускная способность сети1.6 TB / s0.8 TB / s
Внимание Производительность2 ×1 ×

* С разреженностью

** С разреженностью | без разреженности

Сетевая карта и разъем NVIDIA HGX B300 NVL16
Сетевая карта и разъем NVIDIA HGX B300 NVL16

NVIDIA проводит серьезную трансформацию своей платформы HGX B300.  

Во-первых, изменение относительно простое: платформа теперь называется NVIDIA HGX B300 NVL16. NVIDIA приняла это название, поскольку теперь оно подчеркивает количество вычислительных чипов, подключенных через NVLink, а не количество присутствующих пакетов GPU.

Технические характеристики NVIDIA HGX B300 NVL16
Технические характеристики NVIDIA HGX B300 NVL16

До HGX B200 все оставалось по большей части тем же. Однако с появлением NVIDIA HGX B300 NVL16 ситуация меняется. Эта платформа предлагает до 2.3 ТБ памяти HBM3e. Как показано на изображении выше, она оснащена 16 модулями с двумя пакетами графических процессоров Blackwell. В прошлом году NVIDIA обновила чипы коммутатора NVLink с помощью дизайна HGX B200, в котором два чипа коммутатора NVLink расположены между восемью пакетами графических процессоров. Эта конфигурация похожа на ту, что отображается для HGX B300 и его компонентов.

Основная плата NVIDIA HGX B200
Основная плата NVIDIA HGX B200

На изображении ниже вы можете видеть, что материнская плата UBB оснащена восемью большими радиаторами с воздушным охлаждением — каждый из которых охлаждает два графических процессора Blackwell — с секцией коммутатора NVLink, расположенной между ними. Высота модуля составляет приблизительно 5U, как указано в представленном позже модуле HGX B300 от ASUS.

Модуль NVIDIA HGX B300 NVL16
Модуль NVIDIA HGX B300 NVL16

На конце UBB обратите внимание на разъем OCP UBB, закрытый оранжевой крышкой. Высокоплотные разъемы (разъемы ExaMax), используемые в спецификации OCP UBB AMD, NVIDIA и другими производителями, очень хрупкие, поэтому их необходимо закрывать, когда они не используются.

Разъем NVIDIA HGX B300 NVL16
Разъем NVIDIA HGX B300 NVL16

Между этими оранжевыми разъемами и радиаторами графического процессора вы можете заметить радиаторы поменьше. Они больше не предназначены для чипов PCIe retimer; вместо этого они теперь обслуживают сетевые интерфейсные карты NVIDIA ConnectX-8 (NIC).

NVIDIA-HGX-B300-NVL16-NICs-and-Connectors-2-800x496
высокоскоростной и мощный разъем

Высокоскоростные и силовые разъемы UBB 2.0 подключаются к HIB (High-Performance Computing Interface Board). Разъемы NIC находятся между разъемами UBB и восемью сетевыми картами NVIDIA ConnectX-8, установленными на UBB. Аналогичный вид HGX H200 показывает, что эти восемь разъемов, направленных вверх, отсутствуют.

Supermicro SYS 821GE TNHR NVIDIA HGX H200 8 Разъем графического процессора
Supermicro SYS 821GE TNHR NVIDIA HGX H200 8 Разъем графического процессора

NVIDIA использует встроенный коммутатор PCIe ConnectX-8 для предоставления функций, которые ранее требовали дополнительных чипов. Хотя это может показаться незначительным, это представляет собой значительный сдвиг в отрасли. На конференции NVIDIA GTC 2025 года компания ASUS представила ASUS AI Pod NVIDIA GB300 NVL72 и ASUS XA NB3I-E12 (модуль высотой 10U), где съемный лоток UBB в нижней части системы четко показывает восемь портов сетевого подключения.

Плата интерфейса хоста (OAI-HIB)
ASUS-XA-NB3I-E12-с-NVIDIA-HGX-B300-NVL16-передняя панель

Также подробно описаны технические характеристики и интерфейсные разъемы материнской платы UBB 1.X, при этом модель ASUS XA NB3I-E12 оснащена видеокартой NVIDIA HGX B300 NVL16.

Разные поставщики проектировали свои лотки по-разному. Обычно интерфейсы, которые подключаются к передней панели внешнего шасси, располагаются на стороне, противоположной сетевым адаптерам ConnectX-8, что требует прокладки кабелей для преодоления этого зазора. Другие поставщики изучают решения для решения этой проблемы.

Оставьте комментарий

Наверх