NVIDIA의 BlueField-3 DPU의 힘 이해하기

개요

NVIDIA의 H100 SXM 서버로 작업할 때 종종 BFD-3 장치 두 개가 포함된 구성을 볼 수 있습니다. 이는 특히 시스템에 이미 CX-7 400G 네트워크 카드 여덟 개가 포함되어 있기 때문에 의문을 제기합니다. CX-3과 비교했을 때 BFD-7의 근본적인 차이점과 역할은 무엇입니까? 게다가 서버의 마더보드에 이미 BMC 포트가 포함되어 있는데 BFD에 BMC 포트가 있는 이유는 무엇입니까?

DGX H100

NIC, Smart NIC 및 DPU 간의 논리적 관계

NIC, Smart NIC 및 DPU 간의 논리적 관계

그 차이점을 이해하기 위해 다음 사항을 비교해 보겠습니다(참고로 개인적인 견해입니다):

NIC, Smart NIC 및 DPU 간의 관계

스마트 NIC 및 DPU의 등장 이유

기존 NIC 시대

기존 데이터 센터에서는 CPU가 절대적인 핵심이었습니다. 그러나 무어의 법칙이 덜 적용되면서 CPU 컴퓨팅 파워의 성장은 더 이상 데이터 폭발을 따라잡을 수 없어 병목 현상이 발생했습니다. CPU의 작업 부하를 네트워크 어댑터(네트워크 인터페이스 카드)로 오프로드하는 것이 필요해지면서 스마트 NIC의 급속한 개발이 촉진되었습니다.

스마트 NIC 시대(1세대)

1세대 스마트 NIC는 주로 데이터 플레인에서 작업을 오프로드하는 데 중점을 두었습니다. 예로는 OVS Fastpath 하드웨어 오프로드, RoCEv2 및 vXNUMX 기반 RDMA 네트워크 하드웨어 오프로드, 무손실 네트워크 기능(PFC, ECN, ETS)을 위한 하드웨어 오프로드, 스토리지 도메인의 NVMe-oF 하드웨어 오프로드, 보안 전송을 위한 데이터 플레인 오프로드가 있습니다.

DPU 스마트 NIC 시대(2세대)

DPU(데이터 처리 장치)는 데이터 센터의 세 가지 주요 문제를 해결하기 위해 등장했습니다.

노드 간: 서버 데이터 교환의 효율성이 낮고 데이터 전송이 신뢰할 수 없습니다.

노드 내부: 비효율적인 데이터 센터 모델 실행, 낮은 I/O 스위치 효율성, 유연하지 못한 서버 아키텍처.

네트워크 시스템: 안전하지 않은 네트워크.

간단한 설명: DPU가 스마트 NIC보다 우수한 이유

NVIDIA는 DPU 기반 스마트 NIC를 일반적으로 시스템 CPU에서 처리하는 작업을 오프로드하는 네트워크 인터페이스 카드로 정의합니다. 온보드 프로세서를 사용하여 DPU 기반 SmartNIC는 암호화/복호화, 방화벽, TCP/IP 및 HTTP 처리 작업의 조합을 수행할 수 있습니다. 기본적으로 다양한 작업에서 CPU를 지원하고 네트워크 보안 관련 작업을 독립적으로 처리할 자체 CPU가 있습니다.

비교

NVIDIA BlueField-3 DPU 개요

엔비디아 블루필드-3 DPU

하이퍼스케일 클라우드 기술로 인한 데이터 센터 아키텍처의 변화를 해결하기 위해 NVIDIA는 BlueField DPU 시리즈를 출시했습니다. 이 새로운 프로세서는 데이터 센터 인프라 소프트웨어를 위해 특별히 설계되어 가상화, 네트워킹, 스토리지, 보안 및 기타 클라우드 네이티브 AI 서비스에서 생성된 방대한 계산 워크로드를 오프로드하고 가속화합니다.

NVIDIA BlueField-3 DPU의 시스템 레이아웃

BlueField-3는 서버의 PCIe 경로에 통합된 "독립 노드"로 기능합니다.

  1. ARM + OS: 원래 호스트 OS에서 처리하던 다양한 작업을 오프로드할 수 있습니다.
  2. 통합 가속기: 데이터 처리, 보안 및 저장의 효율성을 향상시킵니다.
  3. PCIe 스위치 칩: NVMe SSD 확장 캐비닛에서 사용할 수 있습니다.
  4. BMC 칩: 클라우드 환경에서 원래 호스트 리소스를 독립적으로 관리할 수 있습니다.
엔비다 블루필드 dpu

NVIDIA® BlueField®-3 DPU는 400세대 인프라 컴퓨팅 플랫폼으로, 기업이 클라우드에서 코어 데이터 센터 및 에지 환경까지 소프트웨어 정의, 하드웨어 가속 IT 인프라를 구축할 수 있도록 합니다. 400Gb/s 이더넷 또는 NDR 3Gb/s InfiniBand 네트워크 연결을 통해 BlueField-XNUMX DPU는 소프트웨어 정의 네트워킹, 스토리지, 보안 및 관리 기능을 오프로드, 가속 및 격리하여 데이터 센터 성능, 효율성 및 보안을 크게 향상시킬 수 있습니다.

VMware Private Cloud에서 BlueField-3의 예제 적용

VMware Private Cloud에서 BlueField-3의 예제 적용

NVIDIA DPU 로드맵

NVIDIA DPU 로드맵

BlueField-3 DPU의 기능과 응용 분야를 이해함으로써 기업은 이 기술을 효과적으로 활용하여 현대적 데이터 센터의 요구 사항을 충족하고 견고하고 확장 가능하며 안전한 인프라를 보장할 수 있습니다.

코멘트 남김

위쪽으로 스크롤