Introdução
Ao trabalhar com servidores H100 SXM da NVIDIA, você pode frequentemente ver uma configuração que inclui duas unidades BFD-3. Isso levanta questões, especialmente porque o sistema já vem com oito placas de rede CX-7 400G. Quais são as diferenças e funções fundamentais do BFD-3 em comparação com o CX-7? Além disso, por que o BFD tem uma porta BMC quando a placa-mãe do servidor já inclui uma porta BMC?
Relação lógica entre NIC, Smart NIC e DPU
Para entender suas distinções, vamos comparar os seguintes pontos (opiniões pessoais para referência):
Razões para o surgimento de NICs e DPUs inteligentes
Era dos NICs tradicionais
Em data centers tradicionais, a CPU era o núcleo absoluto. No entanto, à medida que a Lei de Moore se torna menos aplicável, o crescimento do poder de computação da CPU não consegue mais acompanhar a explosão de dados, criando um gargalo. Descarregar a carga de trabalho da CPU em adaptadores de rede (placas de interface de rede) tornou-se necessário, impulsionando o rápido desenvolvimento de NICs inteligentes.
Era das NICs inteligentes (primeira geração)
A primeira geração de NICs inteligentes focou principalmente em tarefas de offloading do plano de dados. Exemplos incluem offloading de hardware OVS Fastpath, offloading de hardware de rede RDMA com base em RoCEv1 e v2, offloading de hardware para recursos de rede sem perdas (PFC, ECN, ETS), offloading de hardware NVMe-oF no domínio de armazenamento e offloading de plano de dados para transmissão segura.
Era das NICs inteligentes DPU (segunda geração)
As DPUs (Unidades de Processamento de Dados) surgiram para resolver três problemas principais em data centers:
Entre nós: Baixa eficiência de troca de dados do servidor e transmissão de dados não confiável.
Dentro dos nós: execução ineficiente do modelo de data center, baixa eficiência do switch de E/S e arquitetura de servidor inflexível.
Sistemas de rede: Redes inseguras.
Explicação simplificada: por que DPUs são superiores a NICs inteligentes
A NVIDIA define NICs inteligentes baseadas em DPU como placas de interface de rede que descarregam tarefas geralmente manipuladas pela CPU do sistema. Usando seu processador integrado, uma SmartNIC baseada em DPU pode executar uma combinação de criptografia/descriptografia, firewall, TCP/IP e tarefas de processamento HTTP. Essencialmente, ela auxilia a CPU com várias tarefas e tem sua própria CPU para manipular tarefas relacionadas à segurança da rede de forma independente.
Visão geral do NVIDIA BlueField-3 DPU
Para lidar com a mudança na arquitetura do data center impulsionada pela tecnologia de nuvem em hiperescala, a NVIDIA apresentou a série BlueField DPU. Esses novos processadores são projetados especificamente para software de infraestrutura de data center, descarregando e acelerando as enormes cargas de trabalho computacionais geradas por virtualização, rede, armazenamento, segurança e outros serviços de IA nativos da nuvem.
Layout do sistema do NVIDIA BlueField-3 DPU
O BlueField-3 funciona como um “nó independente” integrado ao caminho PCIe do servidor:
- ARM + SO: Pode descarregar várias tarefas originalmente manipuladas pelo sistema operacional host.
- Aceleradores integrados: melhoram a eficiência no processamento, segurança e armazenamento de dados.
- Chip de switch PCIe: pode ser usado em gabinetes de expansão SSD NVMe.
- Chip BMC: permite o gerenciamento independente dos recursos do host original em um ambiente de nuvem.
Casos de uso recomendados para BlueField-3
NVIDIA® BlueField®-3 DPU é a plataforma de computação de infraestrutura de terceira geração, permitindo que as empresas criem infraestrutura de TI acelerada por hardware e definida por software, da nuvem aos principais data centers e ambientes de ponta. Com conectividade de rede Ethernet de 400 Gb/s ou NDR 400 Gb/s InfiniBand, a BlueField-3 DPU pode descarregar, acelerar e isolar funções de rede, armazenamento, segurança e gerenciamento definidas por software, melhorando significativamente o desempenho, a eficiência e a segurança do data center.
Exemplo de aplicação do BlueField-3 no VMware Private Cloud
Roteiro de DPU da NVIDIA
Ao compreender os recursos e as aplicações da DPU BlueField-3, as empresas podem aproveitar efetivamente essa tecnologia para atender às demandas dos data centers modernos e garantir uma infraestrutura robusta, escalável e segura.