Na arquitetura de computação moderna, de chips a processadores e data centers, cada nível envolve diferentes tecnologias de interconexão. Estas tecnologias não só garantem a transmissão rápida e segura de dados, mas também fornecem um forte suporte para necessidades informáticas emergentes. Este artigo apresenta principalmente diferentes níveis de tecnologia de interconexão de rede e revela como ela funciona na arquitetura computacional atual. Todo o artigo pode ser dividido em três partes: interconexão Soc system-on-chip, interconexão de processador e interconexão de data center.
Interconexão social
A inovação na interconexão começa no nível mais básico: o sistema em um chip. Quer esteja localizada no chip ou na embalagem, a interconexão avançada significa que os dados se movem mais rapidamente e o desempenho é dimensionado com mais facilidade.
- PIPE (protocolo de camada física expressa de interconexão de componentes periféricos)
PIPE é o protocolo da camada física do PCIe (Peripheral Component Interconnect Express). PCIe é um padrão universal de barramento de computador usado para conectar dispositivos de hardware dentro de um computador, como placas gráficas, unidades de estado sólido, etc. O protocolo da camada física define as características elétricas e os métodos de transmissão de sinal para garantir que os dados possam ser transmitidos corretamente entre o hardware. dispositivos. PCIe suporta a conexão de dispositivos com vários requisitos de desempenho, fornecendo diferentes taxas de transferência de dados e interfaces.
- LPIF (Interface Lógica PHY)
LPIF é um padrão de interface para interconexão de alta velocidade entre processadores, entre processadores e aceleradores e entre chips e chips (die-to-die). O LPIF foi projetado para fornecer uma maneira flexível e escalável de suportar diferentes necessidades de transmissão de dados e permitir a comunicação entre dispositivos em diferentes frequências. Suporta vários protocolos, incluindo PCIe 6.0, CXL 3.0 e UPI 3.0.
- CPI (interface de protocolo CXL Cache-Mem)
CPI é um componente do Compute Express Link (CXL), um protocolo de comunicação projetado especificamente para lidar com cache e memória. CXL é uma tecnologia de interconexão aberta e de alta velocidade projetada para conectar CPUs, GPUs e outros aceleradores, permitindo transmissão de dados em alta velocidade e compartilhamento de recursos entre eles. Como parte do CXL, o CPI define o padrão de interface entre cache e memória para suportar protocolos eficientes de troca de dados e consistência.
- UFI (Interface de Armazenamento Flash Universal)
UFI é um padrão universal de interface de armazenamento flash que permite que diferentes dispositivos de armazenamento se comuniquem e transfiram dados de forma unificada. O padrão UFI foi projetado para melhorar a compatibilidade e o desempenho dos dispositivos de armazenamento, permitindo que os dispositivos funcionem de forma rápida e eficiente.
- UCIe (Universal Chiplet Interconnect Express)
UCIe é uma tecnologia emergente de interconexão de padrão aberto da indústria projetada especificamente para conexões chiplet a chiplet. UCIe oferece suporte a vários protocolos, incluindo PCIe e CXL padrão, bem como protocolos gerais de streaming ou protocolos personalizados. Seu objetivo é adotar uma camada física padrão e uma camada de link para padronizar o protocolo de comunicação entre matrizes, mas manter o protocolo da camada superior flexível. O surgimento da tecnologia UCIe visa enfrentar os desafios trazidos pela desaceleração da Lei de Moore. Ela constrói grandes sistemas empacotando e integrando vários Chiplets para reduzir custos e melhorar a eficiência.
Interconexão do processador
A movimentação de dados entre diferentes mecanismos de computação, memória, E/S e outros periféricos requer um conjunto especializado de tecnologias de interconexão de alta largura de banda e baixa latência. Tecnologias de interconexão de processadores como NVlink, PCIe, CXL e UPI permitem que todos esses elementos operem como um todo, suportando rápida transmissão de dados entre dispositivos.
- NVLink
NVLink é uma tecnologia de interconexão de alta velocidade projetada especificamente para conectar GPUs NVIDIA. Ele permite que as GPUs se comuniquem entre si ponto a ponto, contornando o barramento PCIe tradicional, alcançando maior largura de banda e menor latência. O NVLINK pode ser usado para conectar duas ou mais GPUs para obter transmissão e compartilhamento de dados em alta velocidade, proporcionando maior desempenho e eficiência para sistemas multi-GPU.
- PCIe (Peripheral Component Interconnect Express)
É um padrão de barramento de computador universal usado para conectar dispositivos de hardware dentro do computador, como placas gráficas, unidades de estado sólido, etc. A tecnologia PCIe é amplamente utilizada por seus recursos de transmissão serial de dados em alta velocidade, suportando uma variedade de dispositivos e um ampla variedade de cenários de aplicativos, incluindo data centers, inteligência artificial e interconexão de processadores. A interface PCIe permite que dispositivos iniciem operações DMA para acessar a memória, apenas sabendo que o endereço físico de destino é conhecido. Atualmente está disponível até a versão 6.0, a versão 7.0 está planejada para ser lançada em 2025.
- CXL (Link Compute Express)
É um novo tipo de tecnologia de interconexão de alta velocidade lançada conjuntamente pela Intel, AMD e outras empresas. Seu objetivo é fornecer maior rendimento de dados e menor latência para atender às necessidades dos sistemas modernos de computação e armazenamento. A tecnologia CXL permite que a memória seja compartilhada entre a CPU e os dispositivos, e entre dispositivos, permitindo troca e processamento de dados mais rápidos e flexíveis. CXL contém três subprotocolos: CXL.io, CXL.cache e CXL.memory, que são usados para diferentes tarefas de transmissão de dados e compartilhamento de memória, respectivamente. Atualmente está disponível até a versão 3.1.
Um recurso notável do CXL é seu suporte para consistência de memória, o que significa que os dados podem ser compartilhados entre diferentes dispositivos sem cópia complexa de dados. Essa consistência é particularmente importante para sistemas multiprocessadores e tarefas de computação em larga escala porque pode melhorar a eficiência do acesso a dados, reduzir a latência e, assim, acelerar a computação. Além disso, o CXL oferece a flexibilidade para ser usado em uma ampla variedade de dispositivos e aplicativos, tornando-o uma solução de interconexão universal.
- UPI (Ultra Path Interconnect)
É um protocolo de conexão ponto a ponto desenvolvido pela Intel para comunicação de alta velocidade entre processadores multi-core e/ou múltiplos processadores. Ele foi projetado para substituir a tecnologia anterior QPI (QuickPath Interconnect) e oferece maior largura de banda, menor latência e melhor eficiência energética.
- Tecido infinito
É uma tecnologia de interconexão de alta velocidade desenvolvida pela AMD, usada para conectar vários núcleos, caches e outros componentes dentro dos processadores AMD para obter transmissão e comunicação de dados eficientes. Infinity Fabric usa uma arquitetura distribuída que contém vários canais independentes, cada um dos quais pode realizar transmissão bidirecional de dados. Este design permite comunicação rápida e de baixa latência entre diferentes núcleos, melhorando assim o desempenho geral. Além disso, o Infinity Fabric é escalável e flexível. Ele permite conexões entre diferentes chips e suporta a combinação de vários processadores em sistemas mais poderosos.
Interconexão de Data Center
Os data centers em hiperescala podem ocupar uma área equivalente a vários campos de futebol, criando demandas sem precedentes por velocidade arquitetônica e capacidades de processamento inteligente. As tecnologias de interconexão de alta velocidade e longa distância podem aumentar significativamente o desempenho enquanto executam cálculos com baixa latência. A tecnologia de interconexão em nível de data center é a base para o suporte de serviços modernos de Internet e computação em nuvem. Da transmissão de dados em alta velocidade na camada do rack às conexões de rede do data center, essas tecnologias juntas garantem a eficiência, a estabilidade e a escalabilidade dos data centers.
Técnica de interconexão
- Rede definida por software (SDN)
Rede definida por software (SDN) é um conceito de arquitetura de rede que separa o plano de controle do plano de dados da rede, permitindo que os administradores de rede gerenciem e configurem centralmente o comportamento da rede por meio de programas de software. A ideia central do SDN é abstrair a função de controle inteligente da rede dos dispositivos de rede para realizar o gerenciamento dinâmico e a otimização do tráfego da rede.
- Ethernet e RoCE
Ethernet é a tecnologia de rede mais utilizada e madura, originada do Xerox PARC. Ele pode transmitir grandes quantidades de dados entre servidores em data centers, o que é fundamental para muitas tarefas de computação aceleradas. No protocolo RoCE, a Ethernet integra a função RDMA, que melhora muito o desempenho da comunicação em cenários de computação de alto desempenho. Para enfrentar os novos desafios impostos pelas cargas de trabalho de IA e HPC, os gigantes das redes estabeleceram em conjunto o Ultra Ethernet Consortium (UEC). A pilha de soluções Ultra Ethernet aproveitará a onipresença e a flexibilidade da Ethernet para lidar com uma variedade de cargas de trabalho, sendo ao mesmo tempo escalonável e econômica, injetando nova vitalidade na Ethernet.
RoCE (RDMA over Converged Ethernet): A tecnologia RoCE permite acesso remoto direto à memória em uma rede Ethernet padrão. Ele suporta RDMA otimizando switches Ethernet, fornecendo conexões de rede de alto desempenho e mantendo a compatibilidade com a Ethernet tradicional.
- banda infinita
InfiniBand: Uma tecnologia de rede projetada especificamente para computação de alto desempenho (HPC) que fornece conexões de rede de alta largura de banda e baixa latência, suporta conexões ponto a ponto e acesso remoto direto à memória (RDMA), adequado para operações em grande escala. ambientes de computação e data center.
- Topologia de rede
Topologias comuns incluem topologia de rede em estrela, topologia Fat-tree, topologia Leaf-Spine, topologia hierárquica, etc. Aqui apresentamos principalmente Fat-tree e leaf-spine, ambas arquiteturas de rede de data center baseadas no modelo de rede CLOS.
- Topologia folha-espinha
É um projeto de rede plano que consiste na camada Spine (camada backbone) e na camada Leaf (camada de acesso). Cada switch Leaf é conectado a todos os switches Spine para formar uma topologia de malha completa. Esse design fornece conexões servidor a servidor de alta largura de banda, baixa latência e sem bloqueio, que são fáceis de escalar horizontalmente e possuem alta confiabilidade e facilidade de gerenciamento. As vantagens da arquitetura Leaf-Spine incluem design plano para reduzir a latência, fácil escalabilidade, baixa taxa de convergência, gerenciamento simplificado e gerenciamento multinuvem.
- Topologia Fat-Tree
É um projeto de rede estruturado em árvore, geralmente composto por três camadas: camada central, camada de agregação e camada de acesso. A principal característica da topologia Fat-Tree reside no fato de não haver convergência de largura de banda, ou seja, a largura de banda da rede não converge das folhas para a raiz, o que fornece uma base para a construção de uma rede sem bloqueio em grande escala. Cada um de seus nós (exceto o nó raiz) precisa garantir larguras de banda iguais de upstream e downstream, e todos os switches podem ser iguais, reduzindo assim os custos. No entanto, a topologia Fat-Tree também tem suas limitações, como escalabilidade limitada, baixa tolerância a falhas, implantação desfavorável de certos aplicativos distribuídos de alto desempenho e custos elevados.
- Rede principal/borda
A rede principal é um backbone de rede de alta velocidade e alta confiabilidade responsável pela transmissão de grandes quantidades de dados entre os principais nós da rede e pelo fornecimento de serviços de roteamento. A rede de borda é a camada de acesso da rede, conectando diretamente usuários finais e dispositivos, fornecendo serviços diversificados e otimizando a experiência do usuário.