La plateforme NVIDIA HGX B300 représente une avancée significative dans notre infrastructure informatique. Notamment, sa dernière variante, baptisée NVIDIA HGX B300 NVL16, indique le nombre de puces de calcul interconnectées via NVLink plutôt que le simple nombre de GPU. Ce changement de nomenclature souligne l'évolution de NVIDIA en matière de performances d'interconnexion et d'évolutivité modulaire.

Spécifications
Le tableau suivant décrit les principales spécifications du HGX B300 NVL16 et des variantes antérieures du HGX B200 :
Spécifications | HGX B300 NVL16 | HGX B200 |
Facteur de forme | 16 GPU NVIDIA Blackwell Ultra | 8 GPU NVIDIA Blackwell |
Noyau tenseur FP4** | 144 PFLOPS (avec parcimonie) 144 PFLOPS (sans parcimonie) | 105 PFLOPS (avec parcimonie) 72 PFLOPS (sans parcimonie) |
Noyau Tensor FP8/FP6* | 72hXNUMX FPLOPS | 72hXNUMX FPLOPS |
Noyau tenseur INT8* | 2 POPS | 72 POPS |
Noyau de tenseur FP16/BF16* | 36hXNUMX FPLOPS | 36hXNUMX FPLOPS |
Noyau tenseur TF32* | 18hXNUMX FPLOPS | 18hXNUMX FPLOPS |
Performances FP32 | 600 TFLOPS | 600 TFLOPS |
Noyau Tensor FP64/FP64 | 10 TFLOPS | 296 TFLOPS |
Mémoire totale | Jusqu'à 2.3 TB | 1.4 TB |
Génération NVLink | Cinquième génération | Cinquième génération |
NVIDIA NVSwitch™ | Commutateur NVLink 5 | Commutateur NVLink 5 |
Bande passante GPU à GPU NVSwitch | 1.8 TB / s | 1.8 TB / s |
Bande passante totale NVLink | 14.4 TB / s | 14.4 TB / s |
Bande passante réseau | 1.6 TB / s | 0.8 TB / s |
Performance de l'attention | 2 × | 1 × |
* Avec parcimonie
** Avec parcimonie | sans parcimonie

NVIDIA subit une transformation majeure de sa plateforme HGX B300.
Tout d'abord, le changement est relativement simple : la plateforme s'appelle désormais NVIDIA HGX B300 NVL16. NVIDIA a adopté ce nom car il met désormais l'accent sur le nombre de puces de calcul connectées via NVLink plutôt que sur le nombre de GPU présents.

Avant le HGX B200, la situation était globalement la même. Cependant, avec l'arrivée du NVIDIA HGX B300 NVL16, la donne évolue. Cette plateforme offre jusqu'à 2.3 To de mémoire HBM3e. Comme le montre l'image ci-dessus, elle intègre 16 modules GPU double Blackwell. L'année dernière, NVIDIA a mis à niveau ses puces de commutation NVLink avec le design HGX B200, où deux puces de commutation NVLink sont positionnées entre huit GPU. Cette configuration est similaire à celle présentée pour le HGX B300 et ses composants.

Sur l'image ci-dessous, vous pouvez voir que la carte mère UBB est équipée de huit grands dissipateurs thermiques refroidis par air, chacun refroidissant deux GPU Blackwell, avec la section de commutation NVLink située entre eux. La hauteur du module est d'environ 5U, comme l'indique le module HGX B300 d'ASUS présenté ultérieurement.

À l'extrémité de l'UBB, remarquez un connecteur de type OCP UBB recouvert d'un capuchon orange. Les connecteurs haute densité (connecteurs ExaMax) utilisés dans la spécification OCP UBB par AMD, NVIDIA et d'autres fabricants sont très fragiles ; il est donc essentiel de les recouvrir lorsqu'ils ne sont pas utilisés.

Entre ces connecteurs orange et les dissipateurs thermiques du GPU, on peut observer des dissipateurs thermiques plus petits. Ceux-ci ne sont plus dédiés aux puces de resynchronisation PCIe ; ils sont désormais utilisés par les cartes réseau NVIDIA ConnectX-8.


Les connecteurs UBB 2.0 haut débit et d'alimentation sont reliés à la carte d'interface HIB (High-Performance Computing Interface Board). Les connecteurs de carte réseau se trouvent entre les connecteurs UBB et les huit cartes réseau NVIDIA ConnectX-8 montées sur l'UBB. Une vue similaire du HGX H200 montre l'absence de ces huit connecteurs orientés vers le haut.

NVIDIA exploite le commutateur PCIe intégré du ConnectX-8 pour offrir des fonctionnalités qui nécessitaient auparavant des puces supplémentaires. Bien que cela puisse paraître mineur, cela représente une évolution significative du secteur. Lors de la conférence NVIDIA GTC 2025, ASUS a présenté l'ASUS AI Pod NVIDIA GB300 NVL72 et l'ASUS XA NB3I-E12 (un module de 10U de hauteur), dont le plateau UBB amovible situé sous le système affiche clairement huit ports de connectivité réseau.


Les spécifications de la carte mère UBB 1.X et les connecteurs d'interface sont également mis en évidence, l'ASUS XA NB3I-E12 étant équipé du NVIDIA HGX B300 NVL16.
Les différents fournisseurs ont conçu leurs plateaux de différentes manières. Généralement, les interfaces de connexion au panneau avant du châssis externe sont situées du côté opposé aux cartes réseau ConnectX-8, ce qui nécessite un câblage pour combler cet espace. D'autres fournisseurs étudient des solutions pour pallier ce changement.