Сервер Meta GB300 с жидкостным охлаждением для искусственного интеллекта: Clemente (1U 4xGPU) — революционная инфраструктура искусственного интеллекта

В быстро меняющемся мире центров обработки данных для ИИ серверы с жидкостным охлаждением являются основой высокопроизводительных вычислений. Если вы ищете передовые решения для облачных вычислений, корпоративных сетей или сред с поддержкой ИИ, вам стоит обратить внимание на сервер Meta GB300 с жидкостным охлаждением и ИИ под кодовым названием Clemente. Этот мощный сервер высотой 1U вмещает четыре графических процессора в компактный корпус, расширяя границы плотности, эффективности и масштабируемости. В этой статье мы подробно рассмотрим его архитектуру, инновации в области охлаждения, управления питанием и то, как он вписывается в общие тенденции стоечных систем для ИИ. Независимо от того, являетесь ли вы ИТ-архитектором или энтузиастом ЦОД, понимание особенностей GB300 Clemente поможет вам оптимизировать ваши конфигурации нового поколения.

Эволюция суперузлов ИИ: от агрегированных к дезагрегированным стойкам?

Эволюция суперузлов ИИ

Прежде чем углубляться в детали GB300, давайте взглянем на общую картину масштабирования инфраструктуры ИИ. На глобальном саммите OCP 2025 года компания Meta представила презентацию «Масштабирование инфраструктуры ИИ в регионах центров обработки данных», в которой было отмечено изменение в конструкции стоек для ИИ. Слева направо на изображениях: существующие шкафы с использованием AMD MI300X, собственные ускорители MTIA от Meta, а теперь и GB300 на базе NVIDIA.

GB300 на базе NVIDIA

Для крупномасштабных вычислительных доменов Scale-Up требуются стойки большего размера.

АспектORv3 HPRORW (широкая открытая стойка)Будущие модели
Узел состояния/времениРазвернуто (текущее)Q3 2026Q3 2027
Поддерживаемое количество ускорителей≤ 72≤ 144≥ 256
Тип межсоединенияКабельная объединительная платаКабельная объединительная плата(Не указано, ожидается более продвинутый вариант)
Схема электропитания48 В постоянного тока / ±400 В постоянного тока48 В постоянного тока / ±400 В постоянного тока± 400 В постоянного тока
Способ охлажденияВоздушное охлаждение / Жидкостное охлаждениеВоздушное охлаждение / Жидкостное охлаждениеВ первую очередь жидкостное охлаждение
Технические характеристики стойкиIT/силовой шкаф одинарной шириныIT-шкаф двойной шириныРазмер ИТ-шкафа будет определен
Мощность Мощность(Не указан)(Не указан)> 900 кВт

Ключевые тенденции в области крупномасштабных вычислений ИИ

  • Большие стойки для больших вычислений: Поскольку рабочие нагрузки ИИ требуют всё больше xPU (ускорителей), стойки развиваются. План развития Meta предусматривает масштабирование с текущих установок до 256 и более xPU к третьему кварталу 2027 года с потребляемой мощностью более 900 кВт. Именно здесь вступают в дело стандарты Open Rack Wide (ORW) — совместный проект Meta и AMD, внедрение которого запланировано на третий квартал 2026 года. Он поддерживает будущие графические процессоры Instinct MI450 и делает акцент на открытости инфраструктуры ИИ.
  • Расцвет дезагрегации: Традиционные «агрегированные» решения используют объединительные платы (зелёные и оранжевые линии на схемах) для тесной интеграции компонентов в одной или двух стойках. Но с ростом числа процессоров xPU сложность межсоединений резко возрастает. Встречайте дезагрегацию: ресурсы распределяются по стойкам с меньшей плотностью, соединённым оптическими соединениями для обеспечения связи с малой задержкой и высокой пропускной способностью.

Почему это важно для серверов ИИ, таких как GB300? Дезагрегация повышает гибкость для массового обучения ИИ, обходит ограничения по мощности и охлаждению одной стойки и использует оптику для устранения узких мест в электросети. Это революционный подход для гипермасштабных центров обработки данных, стремящихся к эффективности при работе с ИИ и высокопроизводительными вычислениями.

Дополнительную информацию о стандартах открытых стоек можно найти в наших последних материалах по моделям AMD Helios и Meta OCP Dual-Wide Open Rack 2025 года.

будущее за дезагрегацией

Плотность GB300 NVL72: упаковка 1U с 2x CPU + 4x GPU

общий вид вычислительного лотка Clemente

В основе экосистемы GB300 лежит конфигурация NVL72, а вычислительный лоток Clemente Compute Tray от Meta обеспечивает впечатляющую плотность. Этот лоток размером 1OU вмещает два модуля NVIDIA GB300 HPM, каждый из которых оснащён одним процессором Grace ARM в паре с двумя графическими процессорами B300. Это 4 графических процессора в одном слоте 1U — вдвое больше плотности по сравнению с предыдущей моделью GB200 Catalina (которая поддерживала 2 графических процессора в каждом слоте 1U).

Вид спереди на вычислительный лоток Clemente

Вид спереди и схема подключения

Передняя панель Clemente представляет собой центр подключений:

  • Масштабируемая сеть: 4 порта OSFP 800G для высокоскоростной фабрики искусственного интеллекта.
  • Руководство: Модуль DC-SCM ниже.
  • Дополнительный ввод/вывод: 2 порта 400G слева; 4 отсека для твердотельных накопителей E1.S NVMe справа для быстрого хранения данных.

Плотность мощности? Тепловая мощность (TDP) этого блока питания составляет около 4,200 Вт, а пиковые значения достигают 7,740 Вт, что требует надёжного охлаждения, о котором мы поговорим далее.

Блок-схема: внутренняя архитектура GB300 Clemente

Настоящее волшебство раскрывается на блок-схеме. Для наглядности приведу краткое сравнение с GB200 Catalina (обновлённой для поддержки сетевой карты CX8):

  • Соединения CPU-GPU: Каждый процессор Grace подключается к двум своим графическим процессорам B300 через NVLink C2C. Два Grace подключаются через Clink x12, а B300 используют NVLink 5 для обмена данными между графическими процессорами.
  • Сетевое мастерство: Сетевая карта CX8 имеет один порт 800G и интегрированный коммутатор PCIe для подключения ЦП (Gen5 x16), ГП (Gen6 x16) и SSD. Она также может использоваться как конечная точка PCIe x1 для управления. Каждая модель Grace оснащена выделенным портом CX7. 400G сетевая карта (Gen5 x16), при этом основной Grace0 подключается к BMC через PCIe Gen5 x4.

Такая настройка обеспечивает бесперебойный поток данных в суперузлах ИИ, сводя к минимуму узкие места при обучении больших моделей.

Совместимость: 19-дюймовое шасси в 21-дюймовых открытых стойках

Clemente остаётся верен традициям OCP: это лоток высотой 1RU, подходящий для стандартных 19-дюймовых стоек, с адаптерами для 21-дюймовых стоек Open Rack V3 HPR. Размеры и вес оптимизированы для лёгкого развертывания — точные данные см. на схеме характеристик (обычно менее 30 кг без нагрузки).

Сборка контейнера для адаптации 19-дюймового RU к 21-дюймовому OU

Здесь наглядно демонстрируется раздельный подход к охлаждению: воздушное охлаждение для компонентов с низким тепловыделением (левая сторона на схемах), жидкостное охлаждение через холодные пластины для горячих компонентов (правая сторона).

Воздушное охлаждение для компонентов с низким тепловыделением

Основы жидкостного охлаждения: конструкция островного типа

Нормандский остров Меты жидкостное охлаждение Разработан для максимального TDP под нагрузкой. Основные характеристики GB300 Clemente:

  • Охлаждающая жидкость: 25% смесь пропиленгликоля (PG25), например, Frost LC-25 компании Dow.
  • Температура подачи: стандарт 40°C (максимальное отклонение до 42°C).
  • Расход и давление: До 140 л/мин при перепаде давления 15 фунтов на кв. дюйм.
  • Дельта Т: 10–12 °C при полной нагрузке, что соответствует 1.25–1.5 л/мин/кВт.

Это позволяет графическим процессорам B300 (каждый с TDP около 1,100 Вт) и графическим процессорам Grace оставаться холодными, обеспечивая стабильную производительность ИИ без теплового дросселирования.

Спецификация воздушного охлаждения

Для периферийных устройств с воздушным охлаждением нормы включают стандартные кривые вентиляторов, но жидкостное охлаждение определяет плотность.

Подача питания: от входа 50 В до стоек мощностью 200 кВт

Что касается мощности, Clemente повышает входное напряжение с 48 В до 50 В у GB200, понижая его до 12 В для VRM на процессорах и видеокартах. В стойке NVL72 (18 лотков Clemente) общая мощность составляет около 200 кВт с учётом коммутаторов, конденсаторов и потерь. (Совет: ознакомьтесь с новыми функциями GB300 NVL72 для стабильного питания ИИ.)

Новые функции NVL72 для стабильной работы ИИ

Примечания к шкале:

  • Мощность шкафов с жидкостным охлаждением зачастую достигает 40–200 кВт и более (по данным экспертов по центрам обработки данных).
  • Будущие двухширинные стойки (например, Panjiu от Alibaba) рассчитаны на мощность 650 кВт и более.

Модуль DC-SCM? Простая конфигурация BMC с чипом AST2600 и CPLD для мониторинга.

Подведение итогов: почему GB300 Clemente важен для центров обработки данных ИИ

Сервер Meta GB300 с жидкостным охлаждением и поддержкой искусственного интеллекта (ИИ) от Clemente не просто более плотный — это прототип будущего дезагрегированного ИИ с оптической связью. Благодаря мощности 1U и 4 графических процессоров, эффективному охлаждению и совместимости с OCP он готов к гиперскейлингу 2026+. В то время как стойки для ИИ выходят за пределы 900 кВт, подобные решения обеспечивают масштабируемость без компромиссов.

Блок-схема DC-SCM

В FiberMall мы стремимся расширить возможности этих экосистем, предлагая экономичные продукты и решения для оптической связи. Будучи лидером в области сетей с поддержкой искусственного интеллекта, мы поставляем высококачественные трансиверы, кабели и модули, разработанные специально для центров обработки данных, облачных сред и корпоративных инфраструктур. FiberMall поможет вам в интеграции фабрик NVLink или оптических соединений для разрозненных стоек. Посетите наш официальный сайт или свяжитесь со службой поддержки для получения персональной консультации.

Наверх