L'Ultra Ethernet Consortium (UEC) a été officiellement créé le 19 juillet 2023. Il s'agit d'une nouvelle organisation sponsorisée par la Linux Foundation et sa Joint Development Foundation. L'UEC vise à aller au-delà des capacités Ethernet existantes telles que Remote Direct Memory Access (RDMA) et RDMA over Converged Ethernet (RoCE) pour fournir une couche de transport hautes performances, distribuée et sans perte optimisée pour le calcul hautes performances et l'intelligence artificielle. Il vise directement le protocole de transmission InfiniBand de son rival.
Consortium Ultra Ethernet
Les membres fondateurs de l'UEC comprennent AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta et Microsoft, tous possédant des décennies d'expérience dans le déploiement à grande échelle de réseaux, d'intelligence artificielle, de cloud et de calcul haute performance.
Membres fondateurs
Pourquoi Ethernet a-t-il besoin de l'UEC ?
En quoi l’UEC est-il différent de l’Ethernet actuel ?
L'intelligence artificielle et le calcul haute performance posent de nouveaux défis aux réseaux, tels que le besoin d'une plus grande échelle, d'une densité de bande passante plus élevée, de trajets multiples, d'une réponse rapide à la congestion et d'une interdépendance dans l'exécution des flux de données individuels (où la latence de queue est un point clé pour résoudre les problèmes). considérer). La spécification UEC est conçue pour combler ces lacunes et fournir un réseau à plus grande échelle requis pour ces charges de travail. UEC cible une pile de communications complète qui résout les problèmes techniques sur plusieurs couches de protocole et fournit des fonctionnalités faciles à configurer et à gérer.
En quoi l’UEC est-il différent des autres protocoles actuels ?
Les protocoles existants peuvent résoudre certains aspects des problèmes ci-dessus (tels que la gestion de la congestion existante), mais comme ils sont conçus pour les réseaux généraux, ils manquent de fonctionnalités essentielles à l'intelligence artificielle et au calcul haute performance, telles que les trajets multiples et la configuration facile. Les protocoles existants peuvent également être vulnérables dans des scénarios pertinents. Grâce à la riche expérience des membres de l'UEC dans le déploiement de l'intelligence artificielle et dans les charges de travail de calcul haute performance, l'UEC fournira une solution convaincante et complète qui apportera de nouveaux produits matériels et logiciels non disponibles avec Ethernet ou toute autre technologie réseau aujourd'hui.
Que compte faire l’UEC ?
L'UEC fournira une architecture de pile de communications complète ouverte, interopérable et hautes performances basée sur Ethernet pour répondre aux besoins réseau croissants d'intelligence artificielle à grande échelle et de calcul haute performance. De la couche physique à la couche logicielle, l'UEC prévoit d'apporter des modifications à plusieurs couches de la pile Ethernet. « Il ne s'agit pas de révolutionner Ethernet », a déclaré le président de l'UEC, le Dr J Metz. « Il s'agit de régler Ethernet pour le rendre plus efficace pour les charges de travail ayant des exigences de performances spécifiques. Nous examinons chaque couche, du physique au logiciel, pour trouver les meilleurs moyens d'améliorer l'efficacité et les performances à grande échelle. Metz a noté qu'aujourd'hui, les normes et les organisations de réseau pour Ethernet ne manquent pas et que, même si l'IEEE a joué un rôle majeur, l'UEC se concentre sur plus que la couche de transport physique sur laquelle l'IEEE se concentre généralement. L'objectif de l'UEC est d'étudier tous les éléments nécessaires pour améliorer Ethernet, puis de travailler avec les organismes de normalisation et les groupes techniques concernés pour mettre en œuvre ces améliorations. Le consortium s'efforcera de maintenir et de promouvoir l'interopérabilité Ethernet tout en minimisant les modifications apportées à la pile de communications. L'objectif technique de l'UEC est de développer des spécifications, des API et du code source pour définir :
- Protocoles, caractéristiques des signaux électriques et optiques, interfaces de programmes d'application/structures de données pour les communications Ethernet.
- Protocoles de transport réseau au niveau des liaisons et de bout en bout qui étendent ou remplacent les protocoles de liaison et de transport existants.
- Les mécanismes de congestion, de télémétrie et de signalisation au niveau des liaisons et de bout en bout sont tous adaptés à l'intelligence artificielle, à l'apprentissage automatique et aux environnements informatiques hautes performances.
- Architecture logicielle, de stockage, de gestion et de sécurité pour prendre en charge une variété de charges de travail et d'environnements d'exploitation.
Transmission RDMA contre UEC
Pour améliorer Ethernet, l'UEC a proposé le protocole de transmission UEC. Metz a déclaré que le transport UEC est en cours de développement pour fournir un meilleur transport Ethernet que l'actuel. RDMA (qui prend toujours en charge RDMA), conservant les avantages d'Ethernet/IP tout en offrant les performances requises pour les applications IA et HPC. Le transport UEC est une nouvelle forme proche de la couche transport avec un protocole de réglage sémantique et de notification de congestion et des fonctionnalités de sécurité améliorées. L'UEC fournira un transport plus flexible qui ne nécessite pas de mise en réseau sans perte, permettant des fonctionnalités telles que le transport de paquets multivoies et dans le désordre requis pour les charges de travail d'IA plusieurs à plusieurs. Protocole de transmission UEC :
- Une spécification de protocole ouvert conçue dès le départ pour fonctionner sur IP et Ethernet
- Avec transmission multivoies par pulvérisation de paquets, utilisant pleinement le réseau IA sans provoquer de congestion ou de blocage de tête de ligne, sans avoir besoin d'algorithmes d'équilibrage de charge centralisés et de contrôleurs de routage
- Mécanisme de gestion Incast pour contrôler le fan-in sur la liaison finale vers l'hôte cible avec une perte de paquets minimale
- Un algorithme de contrôle de débit efficace permet à la transmission d'augmenter rapidement la vitesse de ligne sans entraîner de perte de performances des flux concurrents.
- API pour la livraison de paquets dans le désordre avec la possibilité de terminer les messages dans l'ordre, maximisant la concurrence du réseau et des applications et minimisant la latence des messages
- Futur réseau évolutif prenant en charge 1,000,000 XNUMX XNUMX de points de terminaison
- Performances et utilisation optimale du réseau sans avoir besoin de réseau – et réglage spécifique à la charge de travail des paramètres de l'algorithme de congestion
- Conçu pour permettre des performances filaires pour 800G, 1.6T et futur Ethernet plus rapide sur du matériel standard
Le chemin à parcourir pour l’UEC
À l’avenir, les charges de travail et les besoins en réseau de l’IA et du calcul haute performance devraient se chevaucher de plus en plus. En tenant compte des différentes sensibilités à la bande passante et à la latence, la spécification UEC fournira deux profils : l'un optimisé pour l'IA et l'autre optimisé pour le HPC.
Assurer l'interopérabilité grâce aux tests de plug-ins et aux tests de conformité sera une priorité future, a déclaré Uri Elzur, président du comité consultatif technique de l'UEC. L'objectif de l'UEC est d'assurer son ouverture et son interopérabilité. Le projet de spécification UEC sera bientôt publié et pourra être utilisé.
Produits associés:
- NVIDIA MCA7J60-N004 Compatible 4m (13ft) 800G Twin-port OSFP vers 2x400G OSFP InfiniBand NDR Breakout Câble Cuivre Actif $800.00
- NVIDIA MCA4J80-N004 Compatible 4m (13ft) 800G Twin-port 2x400G OSFP à 2x400G OSFP InfiniBand NDR Câble Cuivre Actif $650.00
- Câble en cuivre actif NVIDIA MCA4J80-N003-FTF 3 m (10 pieds) 800G double port 2x400G OSFP vers 2x400G OSFP InfiniBand NDR, dessus plat à une extrémité et dessus à ailettes à l'autre $600.00
- Câble optique actif NVIDIA MFS1S00-H005V compatible 5 m (16 pieds) 200G InfiniBand HDR QSFP56 vers QSFP56 $405.00