Présentation de la carte graphique NVIDIA HGX B300

La plateforme NVIDIA HGX B300 représente une avancée significative dans notre infrastructure informatique. Notamment, sa dernière variante, baptisée NVIDIA HGX B300 NVL16, indique le nombre de puces de calcul interconnectées via NVLink plutôt que le simple nombre de GPU. Ce changement de nomenclature souligne l'évolution de NVIDIA en matière de performances d'interconnexion et d'évolutivité modulaire.

Présentation de la carte graphique NVIDIA HGX B300

 Spécifications 

Le tableau suivant décrit les principales spécifications du HGX B300 NVL16 et des variantes antérieures du HGX B200 :

SpécificationsHGX B300 NVL16HGX B200
Facteur de forme16 GPU NVIDIA Blackwell Ultra8 GPU NVIDIA Blackwell
Noyau tenseur FP4**144 PFLOPS (avec parcimonie) 144 PFLOPS (sans parcimonie)105 PFLOPS (avec parcimonie) 72 PFLOPS (sans parcimonie)
Noyau Tensor FP8/FP6*72hXNUMX FPLOPS72hXNUMX FPLOPS
Noyau tenseur INT8*2 POPS72 POPS
Noyau de tenseur FP16/BF16*36hXNUMX FPLOPS36hXNUMX FPLOPS
Noyau tenseur TF32*18hXNUMX FPLOPS18hXNUMX FPLOPS
Performances FP32600 TFLOPS600 TFLOPS
Noyau Tensor FP64/FP6410 TFLOPS296 TFLOPS
Mémoire totaleJusqu'à 2.3 TB1.4 TB
Génération NVLinkCinquième générationCinquième génération
NVIDIA NVSwitch™Commutateur NVLink 5Commutateur NVLink 5
Bande passante GPU à GPU NVSwitch1.8 TB / s1.8 TB / s
Bande passante totale NVLink14.4 TB / s14.4 TB / s
Bande passante réseau1.6 TB / s0.8 TB / s
Performance de l'attention2 ×1 ×

* Avec parcimonie

** Avec parcimonie | sans parcimonie

Carte réseau et connecteur NVIDIA HGX B300 NVL16
Carte réseau et connecteur NVIDIA HGX B300 NVL16

NVIDIA subit une transformation majeure de sa plateforme HGX B300.  

Tout d'abord, le changement est relativement simple : la plateforme s'appelle désormais NVIDIA HGX B300 NVL16. NVIDIA a adopté ce nom car il met désormais l'accent sur le nombre de puces de calcul connectées via NVLink plutôt que sur le nombre de GPU présents.

Spécifications de la carte graphique NVIDIA HGX B300 NVL16
Spécifications de la carte graphique NVIDIA HGX B300 NVL16

Avant le HGX B200, la situation était globalement la même. Cependant, avec l'arrivée du NVIDIA HGX B300 NVL16, la donne évolue. Cette plateforme offre jusqu'à 2.3 To de mémoire HBM3e. Comme le montre l'image ci-dessus, elle intègre 16 modules GPU double Blackwell. L'année dernière, NVIDIA a mis à niveau ses puces de commutation NVLink avec le design HGX B200, où deux puces de commutation NVLink sont positionnées entre huit GPU. Cette configuration est similaire à celle présentée pour le HGX B300 et ses composants.

Carte mère NVIDIA HGX B200
Carte mère NVIDIA HGX B200

Sur l'image ci-dessous, vous pouvez voir que la carte mère UBB est équipée de huit grands dissipateurs thermiques refroidis par air, chacun refroidissant deux GPU Blackwell, avec la section de commutation NVLink située entre eux. La hauteur du module est d'environ 5U, comme l'indique le module HGX B300 d'ASUS présenté ultérieurement.

Module NVIDIA HGX B300 NVL16
Module NVIDIA HGX B300 NVL16

À l'extrémité de l'UBB, remarquez un connecteur de type OCP UBB recouvert d'un capuchon orange. Les connecteurs haute densité (connecteurs ExaMax) utilisés dans la spécification OCP UBB par AMD, NVIDIA et d'autres fabricants sont très fragiles ; il est donc essentiel de les recouvrir lorsqu'ils ne sont pas utilisés.

Connecteur NVIDIA HGX B300 NVL16
Connecteur NVIDIA HGX B300 NVL16

Entre ces connecteurs orange et les dissipateurs thermiques du GPU, on peut observer des dissipateurs thermiques plus petits. Ceux-ci ne sont plus dédiés aux puces de resynchronisation PCIe ; ils sont désormais utilisés par les cartes réseau NVIDIA ConnectX-8.

NVIDIA-HGX-B300-NVL16-NICs-and-Connectors-2-800x496
connecteur haute vitesse et d'alimentation

Les connecteurs UBB 2.0 haut débit et d'alimentation sont reliés à la carte d'interface HIB (High-Performance Computing Interface Board). Les connecteurs de carte réseau se trouvent entre les connecteurs UBB et les huit cartes réseau NVIDIA ConnectX-8 montées sur l'UBB. Une vue similaire du HGX H200 montre l'absence de ces huit connecteurs orientés vers le haut.

Connecteur Supermicro SYS 821GE TNHR NVIDIA HGX H200 8 GPU
Connecteur Supermicro SYS 821GE TNHR NVIDIA HGX H200 8 GPU

NVIDIA exploite le commutateur PCIe intégré du ConnectX-8 pour offrir des fonctionnalités qui nécessitaient auparavant des puces supplémentaires. Bien que cela puisse paraître mineur, cela représente une évolution significative du secteur. Lors de la conférence NVIDIA GTC 2025, ASUS a présenté l'ASUS AI Pod NVIDIA GB300 NVL72 et l'ASUS XA NB3I-E12 (un module de 10U de hauteur), dont le plateau UBB amovible situé sous le système affiche clairement huit ports de connectivité réseau.

Carte d'interface hôte (OAI-HIB)
ASUS-XA-NB3I-E12-avec-NVIDIA-HGX-B300-NVL16-Avant

Les spécifications de la carte mère UBB 1.X et les connecteurs d'interface sont également mis en évidence, l'ASUS XA NB3I-E12 étant équipé du NVIDIA HGX B300 NVL16.

Les différents fournisseurs ont conçu leurs plateaux de différentes manières. Généralement, les interfaces de connexion au panneau avant du châssis externe sont situées du côté opposé aux cartes réseau ConnectX-8, ce qui nécessite un câblage pour combler cet espace. D'autres fournisseurs étudient des solutions pour pallier ce changement.

Laisser un commentaire

Remonter en haut