«Суперкубок» индустрии искусственного интеллекта уже начался, и сегодня его звездой является Дженсен Хуан.
Предприниматели в сфере технологий, разработчики, ученые, инвесторы, клиенты NVIDIA, партнеры и представители СМИ со всего мира съехались в небольшой город Сан-Хосе ради человека в черной кожаной куртке.
Основной доклад Хуана на GTC 2025 начался в 10:00 по местному времени 18 марта, но к 6:00 основатель Doges AI Абрахам Гомес уже занял второе место в очереди в SAP Center, надеясь «занять место в первом ряду». К 8:00 утра очередь снаружи растянулась более чем на километр.
Билл, генеральный директор стартапа музыкального поколения Wondera, сидел в первом ряду в своей собственной черной кожаной куртке «в память о Дженсене». Пока толпа была в восторге, Хуан избрал более размеренный тон по сравнению с прошлогодней энергией рок-звезды. На этот раз он стремился подтвердить стратегию NVIDIA, неоднократно подчеркивая «масштабирование» на протяжении всей своей речи.
В прошлом году Хуан заявил, что «будущее генеративно»; в этом году он заявил, что «ИИ находится на переломном этапе». Его основной доклад был сосредоточен на трех ключевых заявлениях:
1. Blackwell GPU выходит на полную мощность
«Спрос невероятен, и на то есть веская причина — ИИ находится на переломном этапе», — заявил Хуан. Он подчеркнул растущую потребность в вычислительной мощности, обусловленную системами вывода ИИ и рабочими нагрузками агентского обучения.
2. Blackwell NVLink 72 с программным обеспечением Dynamo AI
Новая платформа обеспечивает в 40 раз большую производительность фабрики ИИ, чем NVIDIA Hopper. «По мере масштабирования ИИ, вывод будет доминировать в рабочих нагрузках в течение следующего десятилетия», — объяснил Хуан. Представляя Blackwell Ultra, он возродил классическую фразу: «Чем больше вы покупаете, тем больше вы экономите. На самом деле, даже лучше — чем больше вы покупаете, тем больше вы зарабатываете».
3. Ежегодная дорожная карта NVIDIA для инфраструктуры ИИ
Компания выделила три основных направления инфраструктуры ИИ: облако, корпоративное использование и робототехника.

Хуан также представил два новых графических процессора: Blackwell Ultra GB300 (модернизированный Blackwell) и архитектуру следующего поколения Vera Rubin с Rubin Ultra.
NVIDIA представила два новых графических процессора: Blackwell Ultra GB300, усовершенствованную версию прошлогоднего Blackwell, и совершенно новую архитектуру чипа под названием Vera Rubin, а также Rubin Ultra.
Непоколебимая вера Дженсена Хуанга в закон масштабирования коренится в достижениях, достигнутых в ходе развития нескольких поколений архитектур микросхем.
Его основная речь была посвящена теме «Экстремальные вычисления для крупномасштабного вывода ИИ».
В выводе ИИ масштабирование от индивидуальных пользователей до крупномасштабных развертываний требует нахождения оптимального баланса между производительностью и экономической эффективностью. Системы должны не только обеспечивать быстрые ответы для пользователей, но и максимизировать общую пропускную способность (токенов в секунду) за счет улучшения аппаратных возможностей (например, FLOPS, пропускная способность HBM) и оптимизации программного обеспечения (например, архитектуры, алгоритмов), в конечном итоге раскрывая экономическую ценность крупномасштабного вывода.

Комментируя опасения по поводу замедления действия Закона о масштабировании, Дженсен Хуан выразил противоположную точку зрения, заявив, что «новые методы и технологии расширения ускоряют совершенствование ИИ беспрецедентными темпами».
Испытывая значительное давление, Хуан выглядел заметно напряженным во время прямой трансляции, часто потягивая воду во время перерывов, а к концу выступления его голос слегка охрип.
По мере того, как рынок ИИ переходит от «обучения» к «выводу», такие конкуренты, как AMD, Intel, Google и Amazon, внедряют специализированные чипы вывода, чтобы снизить зависимость от NVIDIA. Тем временем, такие стартапы, как Cerebras, Groq и Tenstorrent, ускоряют разработку ускорителей ИИ, а такие компании, как DeepSeek, стремятся минимизировать зависимость от дорогостоящих графических процессоров, оптимизируя свои модели. Эта динамика способствует проблемам, с которыми сталкивается Хуан. Хотя NVIDIA доминирует более чем на 90% на рынке обучения, Хуан полон решимости не уступать рынок вывода в условиях усиливающейся конкуренции. Баннер на входе на мероприятие смело вопрошал: «Что дальше в ИИ начинается здесь».

Основные моменты доклада Дженсена Хуанга, кратко изложенные на месте «FiberMall», включают:
Мир неправильно понял закон масштабирования
За последнее десятилетие ИИ представлял собой преобразующую возможность для NVIDIA, и Хуан по-прежнему глубоко уверен в его потенциале. На этом GTC он пересмотрел два слайда из своего январского доклада на CES:
На первом слайде были описаны этапы развития ИИ: ИИ восприятия, генеративный ИИ, агентный ИИ и физический ИИ.

На втором слайде изображены три фазы закона масштабирования: масштабирование до обучения, масштабирование после обучения и масштабирование во время тестирования (длительное мышление).

Хуан предложил точку зрения, резко контрастирующую с общепринятыми взглядами, утверждая, что опасения по поводу замедления Закона о масштабировании неуместны. По его мнению, новые методы и технологии расширения стимулируют прогресс ИИ беспрецедентными темпами.
Будучи твердым сторонником Закона масштабирования, Хуан убежден в том, что глобальные достижения ИИ тесно связаны с бизнесом NVIDIA в области графических процессоров. Он продолжил описывать эволюцию ИИ, который может «рассуждать шаг за шагом», подчеркивая роль вывода и обучения с подкреплением в управлении вычислительными потребностями. Поскольку ИИ достигает «переломного момента», поставщики облачных услуг все больше требуют графические процессоры, и Хуан оценивает, что стоимость строительства центров обработки данных достигнет 1 триллиона долларов.
Хуан уточнил, что библиотеки ускорения графических процессоров NVIDIA CUDA-X и микросервисы теперь обслуживают почти каждую отрасль. По его мнению, в будущем каждая компания будет управлять двумя фабриками: одной для производства товаров и другой для генерации ИИ.

ИИ распространяется в различных областях по всему миру, включая робототехнику, автономные транспортные средства, заводы и беспроводные сети. Дженсен Хуанг подчеркнул, что одним из самых ранних применений ИИ были автономные транспортные средства, заявив: «Технологии, которые мы разработали, используются почти каждой компанией, занимающейся автономными транспортными средствами», как в центрах обработки данных, так и в автомобильной промышленности.
Дженсен объявил о важной вехе в области автономного вождения: General Motors, крупнейший автопроизводитель в США, внедряет ИИ NVIDIA, моделирование и ускоренные вычисления для разработки своих автомобилей, заводов и роботов следующего поколения. Он также представил NVIDIA Halos, интегрированную систему безопасности, объединяющую автомобильные аппаратные и программные решения безопасности NVIDIA с передовыми исследованиями ИИ в области безопасности автономных транспортных средств.

Переходя к центрам обработки данных и выводу, Хуан рассказал, что NVIDIA Blackwell вышла на полномасштабное производство, представив системы от многочисленных отраслевых партнеров. Довольный потенциалом Blackwell, он подробно рассказал о том, как он поддерживает экстремальную масштабируемость, объяснив: «Мы стремимся решить критическую задачу, и это то, что мы называем выводом».
Хуан подчеркнул, что вывод включает в себя генерацию токенов, процесс, необходимый для бизнеса. Эти фабрики ИИ, которые генерируют токены, должны быть построены с исключительной эффективностью и производительностью. С новейшими моделями вывода, способными решать все более сложные проблемы, спрос на токены будет продолжать расти.
Для дальнейшего ускорения крупномасштабного вывода Хуан анонсировал NVIDIA Dynamo, программную платформу с открытым исходным кодом, предназначенную для оптимизации и масштабирования моделей вывода на фабриках ИИ. Описывая ее как «по сути операционную систему для фабрик ИИ», он подчеркнул ее преобразующий потенциал.

«Покупайте больше, экономьте больше, зарабатывайте больше»
NVIDIA также представила два новых графических процессора: Blackwell Ultra GB300, усовершенствованную версию прошлогоднего Blackwell, а также чипсеты следующего поколения Vera Rubin и Rubin Ultra.
Blackwell Ultra GB300 поступит в продажу во второй половине этого года.
Выход фильма «Вера Рубин» запланирован на вторую половину следующего года.
Ожидается, что Rubin Ultra появится в конце 2027 года.
Кроме того, Хуан представил дорожную карту будущих чипов. Архитектура для поколения после Rubin получила название Feynman, ожидаемое в 2028 году. Название, вероятно, дано в честь известного физика-теоретика Ричарда Фейнмана.
Продолжая традицию NVIDIA, каждая архитектура графического процессора названа в честь выдающихся ученых: Blackwell — в честь статистика Дэвида Гарольда Блэквелла, а Rubin — в честь Веры Рубин, новаторского астрофизика, подтвердившего существование темной материи.

За последнее десятилетие NVIDIA выпустила 13 поколений архитектур GPU, в среднем по одному новому поколению в год. Среди них такие знаковые имена, как Tesla, Fermi, Kepler, Maxwell, Pascal, Turing, Ampere, Hopper и совсем недавно Rubin. Приверженность Хуанга закону масштабирования стала движущей силой этих инноваций.
Что касается производительности, Blackwell Ultra предлагает существенные улучшения по сравнению с Blackwell, включая увеличение объема памяти HBM3e с 192 ГБ до 288 ГБ. NVIDIA также сравнила Blackwell Ultra с чипом H100, выпущенным в 2022 году, отметив его способность обеспечивать в 1.5 раза большую производительность вывода FP4. Это означает значительное преимущество: кластер NVL72, работающий на модели DeepSeek-R1 671B, может предоставлять интерактивные ответы за 10 секунд по сравнению с 1.5 минутами с H100. Blackwell Ultra обрабатывает 1,000 токенов в секунду, что в 10 раз больше, чем у H100.

NVIDIA также предложит одностоечную систему GB300 NVL72, включающую:
1.1 экзафлопс FP4,
20 ТБ памяти HBM,
40 ТБ «быстрой памяти»,
130 ТБ/с пропускной способности NVLink и
Скорость сети 14.4 ТБ/с.
Признавая ошеломляющую производительность Blackwell Ultra, Хуан пошутил о своих опасениях, что клиенты могут отказаться от покупки H100. Он с юмором назвал себя «главным разрушителем доходов», признав, что в ограниченных случаях чипсы Hopper «нормальны», но такие сценарии редки. Завершая свою классическую фразу, он заявил: «Покупайте больше, экономьте больше. Это даже лучше, чем это. Теперь, чем больше вы покупаете, тем больше вы зарабатываете».
Архитектура Rubin представляет собой новаторский шаг для NVIDIA. Дженсен Хуанг подчеркнул: «По сути, все, кроме стойки, совершенно новое».
Улучшенная производительность FP4: графические процессоры Rubin достигают 50 петафлопс, превосходя 20 петафлопс Blackwell. Rubin Ultra состоит из одного чипа с двумя взаимосвязанными графическими процессорами Rubin, обеспечивая производительность FP100 в 4 петафлопс — вдвое больше, чем у Rubin — и почти учетверяя объем памяти до 1 ТБ.
NVL576 Rubin Ultra Rack: обеспечивает 15 экзафлопс логического вывода FP4 и 5 экзафлопс обучения FP8, что в 14 раз превышает производительность стоек Blackwell Ultra.

Хуан также объяснил интеграцию фотонной технологии для масштабирования систем, включив ее в кремниевые фотонные сетевые коммутаторы Spectrum-X и Quantum-X от NVIDIA. Эти инновации объединяют электронную и оптическую связь, позволяя фабрикам ИИ соединять миллионы графических процессоров на разных площадках, одновременно снижая потребление энергии и затраты.

Коммутаторы исключительно эффективны: они обеспечивают в 3.5 раза большую энергоэффективность, в 63 раза большую целостность сигнала, в 10 раз большую устойчивость сети и более быстрое развертывание по сравнению с традиционными методами.
Компьютеры для эпохи ИИ
Расширяясь за пределы облачных чипов и центров обработки данных, NVIDIA выпустила настольные суперкомпьютеры ИИ на базе платформы NVIDIA Grace Blackwell. Эти устройства, предназначенные для разработчиков ИИ, исследователей, специалистов по данным и студентов, позволяют создавать прототипы, настраивать и делать выводы из больших моделей на уровне настольных компьютеров.

Основные продукты включают в себя:
Суперкомпьютеры DGX: оснащены платформой NVIDIA Grace Blackwell для непревзойденных возможностей локального или облачного развертывания.
Станция DGX: высокопроизводительная рабочая станция, оснащенная Blackwell Ultra.

Серия выводов Llama Nemotron: семейство моделей ИИ с открытым исходным кодом, предлагающее улучшенные многошаговые рассуждения, кодирование и принятие решений. Улучшения NVIDIA повышают точность на 20%, скорость вывода в 5 раз и эффективность эксплуатационных затрат. Ведущие компании, такие как Microsoft, SAP и Accenture, сотрудничают с NVIDIA для разработки новых моделей вывода.
Эра робототехники общего назначения
Дженсен Хуанг объявил роботов следующей отраслью стоимостью 10 триллионов долларов, решая глобальную нехватку рабочей силы, которая, как ожидается, достигнет 50 миллионов рабочих к концу века. NVIDIA представила Isaac GR00T N1, первую в мире открытую, полностью настраиваемую гуманоидную модель вывода и основы навыков, а также новую генерацию данных и фреймворк обучения робототехники. Это прокладывает путь к следующему рубежу в области ИИ.
Кроме того, NVIDIA выпустила модель Cosmos Foundation для разработки физического ИИ. Эта открытая, настраиваемая модель дает разработчикам беспрецедентный контроль над генерацией мира, создавая обширные и систематически бесконечные наборы данных посредством интеграции с Omniverse.
Хуан также представил Newton, физический движок с открытым исходным кодом для моделирования робототехники, разработанный совместно с Google DeepMind и Disney Research. В памятный момент миниатюрный робот по имени «Blue», который ранее появлялся на прошлогоднем GTC, снова появился на сцене, порадовав публику.

Текущий путь NVIDIA был направлен на поиск приложений для ее графических процессоров, от прорывов в области ИИ с AlexNet более десяти лет назад до сегодняшнего внимания к робототехнике и физическому ИИ. Принесут ли плоды устремления NVIDIA на следующее десятилетие? Время покажет.
Сопутствующие товары:
-
Совместимый с NVIDIA MMA4Z00-NS400 400G OSFP SR4 Flat Top PAM4 850 нм 30 м на OM3/50 м на OM4 MTP/MPO-12 Многомодовый модуль оптического трансивера FEC $650.00
-
Совместимый с NVIDIA MMS4X00-NS400 400G OSFP DR4 Flat Top PAM4 1310nm MTP/MPO-12 500m SMF FEC Модуль оптического трансивера $800.00
-
NVIDIA MMA1Z00-NS400 совместимый модуль оптического приемопередатчика 400G QSFP112 SR4 PAM4 850nm 100m MTP/MPO-12 OM3 FEC $650.00
-
Совместимость с NVIDIA MMS1Z00-NS400 400G NDR QSFP112 DR4 PAM4 1310 нм 500 м MPO-12 с модулем оптического приемопередатчика FEC $800.00
-
NVIDIA MMA4Z00-NS Совместимый двухпортовый OSFP 800 Гбит/с 2x400G SR8 PAM4 850 нм 100 м DOM Двойной модуль оптического трансивера MPO-12 MMF $750.00
-
NVIDIA MMA4Z00-NS-FLT Совместимый двухпортовый OSFP 800 Гбит/с 2x400G SR8 PAM4 850 нм 100 м DOM Двойной модуль оптического трансивера MPO-12 MMF $850.00
-
NVIDIA MMS4X00-NM Совместимый двухпортовый OSFP 800 Гбит/с 2x400G PAM4 1310nm 500m DOM Dual MTP/MPO-12 SMF Модуль оптического трансивера $1100.00
-
Совместимый с NVIDIA MMS4X00-NM-FLT 800G Twin-port OSFP 2x400G Flat Top PAM4 1310nm 500m DOM Dual MTP/MPO-12 SMF Модуль оптического трансивера $1200.00
-
Совместимый с OSFP NVIDIA MMS4X50-NM 2x400G FR4 PAM4 1310 нм 2 км DOM двухдуплексный оптический модуль LC SMF $1350.00
-
Совместимый с NVIDIA MCP7Y00-N001 1 м (3 фута) 800Gb OSFP с двумя портами на 2x400G OSFP InfiniBand NDR Breakout Медный кабель прямого подключения $175.00
-
NVIDIA MCA7J60-N004 Совместимый кабель длиной 4 м (13 футов) 800G с двумя портами OSFP для 2x400G OSFP InfiniBand NDR Breakout Active Copper Cable $800.00
-
NVIDIA MCP7Y10-N001, совместимый с двухпортовым OSFP 1G InfiniBand NDR длиной 3 м (800 фута) с 2x400G QSFP112 Breakout ЦАП $165.00
-
NVIDIA MCP7Y50-N001 Совместимый 1 м (3 фута) 800G InfiniBand NDR Двухпортовый OSFP на 4x200G OSFP Breakout DAC $295.00
-
NVIDIA MCA7J70-N004 Совместимость 4 м (13 футов) 800G InfiniBand NDR Двухпортовый OSFP на 4x200G OSFP Breakout ACC $1100.00
-
NVIDIA MCA4J80-N003 Совместимый двухпортовый 800G 2x400G OSFP на 2x400G OSFP Активный медный кабель InfiniBand NDR $600.00
-
Совместимый с NVIDIA MCP4Y10-N002-FLT двухпортовый ЦАП InfiniBand NDR с двумя портами 2G длиной 7 м (800 футов) от 2x400G OSFP до 2x400G OSFP Пассивный ЦАП InfiniBand NDR, плоская вершина на одном конце и плоская вершина на другом $300.00
-
NVIDIA MCP4Y10-N00A Совместимый 0.5-метровый (1.6 футов) двухпортовый кабель 800G OSFP от 2x400G OSFP до 2x400G OSFP InfiniBand NDR Пассивный медный кабель прямого подключения $105.00
-
NVIDIA MCA4J80-N003-FLT, совместимый с двумя портами 3G длиной 10 м (800 футов) от 2x400G OSFP до 2x400G OSFP Активный медный кабель InfiniBand NDR, плоская верхняя часть на одном конце и плоская верхняя часть на другом $600.00