Закон масштабирования неправильно понят, NVIDIA запускает Blackwell & Rubin

«Суперкубок» индустрии искусственного интеллекта уже начался, и сегодня его звездой является Дженсен Хуан.

Предприниматели в сфере технологий, разработчики, ученые, инвесторы, клиенты NVIDIA, партнеры и представители СМИ со всего мира съехались в небольшой город Сан-Хосе ради человека в черной кожаной куртке.

Основной доклад Хуана на GTC 2025 начался в 10:00 по местному времени 18 марта, но к 6:00 основатель Doges AI Абрахам Гомес уже занял второе место в очереди в SAP Center, надеясь «занять место в первом ряду». К 8:00 утра очередь снаружи растянулась более чем на километр.

Билл, генеральный директор стартапа музыкального поколения Wondera, сидел в первом ряду в своей собственной черной кожаной куртке «в память о Дженсене». Пока толпа была в восторге, Хуан избрал более размеренный тон по сравнению с прошлогодней энергией рок-звезды. На этот раз он стремился подтвердить стратегию NVIDIA, неоднократно подчеркивая «масштабирование» на протяжении всей своей речи.

В прошлом году Хуан заявил, что «будущее генеративно»; в этом году он заявил, что «ИИ находится на переломном этапе». Его основной доклад был сосредоточен на трех ключевых заявлениях:

1. Blackwell GPU выходит на полную мощность

«Спрос невероятен, и на то есть веская причина — ИИ находится на переломном этапе», — заявил Хуан. Он подчеркнул растущую потребность в вычислительной мощности, обусловленную системами вывода ИИ и рабочими нагрузками агентского обучения.

2. Blackwell NVLink 72 с программным обеспечением Dynamo AI

Новая платформа обеспечивает в 40 раз большую производительность фабрики ИИ, чем NVIDIA Hopper. «По мере масштабирования ИИ, вывод будет доминировать в рабочих нагрузках в течение следующего десятилетия», — объяснил Хуан. Представляя Blackwell Ultra, он возродил классическую фразу: «Чем больше вы покупаете, тем больше вы экономите. На самом деле, даже лучше — чем больше вы покупаете, тем больше вы зарабатываете».

3. Ежегодная дорожная карта NVIDIA для инфраструктуры ИИ

Компания выделила три основных направления инфраструктуры ИИ: облако, корпоративное использование и робототехника.

ИИ для каждой отрасли

Хуан также представил два новых графических процессора: Blackwell Ultra GB300 (модернизированный Blackwell) и архитектуру следующего поколения Vera Rubin с Rubin Ultra.

NVIDIA представила два новых графических процессора: Blackwell Ultra GB300, усовершенствованную версию прошлогоднего Blackwell, и совершенно новую архитектуру чипа под названием Vera Rubin, а также Rubin Ultra.

Непоколебимая вера Дженсена Хуанга в закон масштабирования коренится в достижениях, достигнутых в ходе развития нескольких поколений архитектур микросхем.

Его основная речь была посвящена теме «Экстремальные вычисления для крупномасштабного вывода ИИ».

В выводе ИИ масштабирование от индивидуальных пользователей до крупномасштабных развертываний требует нахождения оптимального баланса между производительностью и экономической эффективностью. Системы должны не только обеспечивать быстрые ответы для пользователей, но и максимизировать общую пропускную способность (токенов в секунду) за счет улучшения аппаратных возможностей (например, FLOPS, пропускная способность HBM) и оптимизации программного обеспечения (например, архитектуры, алгоритмов), в конечном итоге раскрывая экономическую ценность крупномасштабного вывода.

вывод в масштабе — это экстремальные вычисления

Комментируя опасения по поводу замедления действия Закона о масштабировании, Дженсен Хуан выразил противоположную точку зрения, заявив, что «новые методы и технологии расширения ускоряют совершенствование ИИ беспрецедентными темпами».

Испытывая значительное давление, Хуан выглядел заметно напряженным во время прямой трансляции, часто потягивая воду во время перерывов, а к концу выступления его голос слегка охрип.

По мере того, как рынок ИИ переходит от «обучения» к «выводу», такие конкуренты, как AMD, Intel, Google и Amazon, внедряют специализированные чипы вывода, чтобы снизить зависимость от NVIDIA. Тем временем, такие стартапы, как Cerebras, Groq и Tenstorrent, ускоряют разработку ускорителей ИИ, а такие компании, как DeepSeek, стремятся минимизировать зависимость от дорогостоящих графических процессоров, оптимизируя свои модели. Эта динамика способствует проблемам, с которыми сталкивается Хуан. Хотя NVIDIA доминирует более чем на 90% на рынке обучения, Хуан полон решимости не уступать рынок вывода в условиях усиливающейся конкуренции. Баннер на входе на мероприятие смело вопрошал: «Что дальше в ИИ начинается здесь».

Что будет дальше в области ИИ? Начинается здесь

Основные моменты доклада Дженсена Хуанга, кратко изложенные на месте «FiberMall», включают:

Мир неправильно понял закон масштабирования

За последнее десятилетие ИИ представлял собой преобразующую возможность для NVIDIA, и Хуан по-прежнему глубоко уверен в его потенциале. На этом GTC он пересмотрел два слайда из своего январского доклада на CES:

На первом слайде были описаны этапы развития ИИ: ИИ восприятия, генеративный ИИ, агентный ИИ и физический ИИ.

этапы развития ИИ

На втором слайде изображены три фазы закона масштабирования: масштабирование до обучения, масштабирование после обучения и масштабирование во время тестирования (длительное мышление).

три фазы закона масштабирования

Хуан предложил точку зрения, резко контрастирующую с общепринятыми взглядами, утверждая, что опасения по поводу замедления Закона о масштабировании неуместны. По его мнению, новые методы и технологии расширения стимулируют прогресс ИИ беспрецедентными темпами.

Будучи твердым сторонником Закона масштабирования, Хуан убежден в том, что глобальные достижения ИИ тесно связаны с бизнесом NVIDIA в области графических процессоров. Он продолжил описывать эволюцию ИИ, который может «рассуждать шаг за шагом», подчеркивая роль вывода и обучения с подкреплением в управлении вычислительными потребностями. Поскольку ИИ достигает «переломного момента», поставщики облачных услуг все больше требуют графические процессоры, и Хуан оценивает, что стоимость строительства центров обработки данных достигнет 1 триллиона долларов.

Хуан уточнил, что библиотеки ускорения графических процессоров NVIDIA CUDA-X и микросервисы теперь обслуживают почти каждую отрасль. По его мнению, в будущем каждая компания будет управлять двумя фабриками: одной для производства товаров и другой для генерации ИИ.

Графический процессор CUDA-X

ИИ распространяется в различных областях по всему миру, включая робототехнику, автономные транспортные средства, заводы и беспроводные сети. Дженсен Хуанг подчеркнул, что одним из самых ранних применений ИИ были автономные транспортные средства, заявив: «Технологии, которые мы разработали, используются почти каждой компанией, занимающейся автономными транспортными средствами», как в центрах обработки данных, так и в автомобильной промышленности.

Дженсен объявил о важной вехе в области автономного вождения: General Motors, крупнейший автопроизводитель в США, внедряет ИИ NVIDIA, моделирование и ускоренные вычисления для разработки своих автомобилей, заводов и роботов следующего поколения. Он также представил NVIDIA Halos, интегрированную систему безопасности, объединяющую автомобильные аппаратные и программные решения безопасности NVIDIA с передовыми исследованиями ИИ в области безопасности автономных транспортных средств.

автономный автомобиль

Переходя к центрам обработки данных и выводу, Хуан рассказал, что NVIDIA Blackwell вышла на полномасштабное производство, представив системы от многочисленных отраслевых партнеров. Довольный потенциалом Blackwell, он подробно рассказал о том, как он поддерживает экстремальную масштабируемость, объяснив: «Мы стремимся решить критическую задачу, и это то, что мы называем выводом».

Хуан подчеркнул, что вывод включает в себя генерацию токенов, процесс, необходимый для бизнеса. Эти фабрики ИИ, которые генерируют токены, должны быть построены с исключительной эффективностью и производительностью. С новейшими моделями вывода, способными решать все более сложные проблемы, спрос на токены будет продолжать расти.

Для дальнейшего ускорения крупномасштабного вывода Хуан анонсировал NVIDIA Dynamo, программную платформу с открытым исходным кодом, предназначенную для оптимизации и масштабирования моделей вывода на фабриках ИИ. Описывая ее как «по сути операционную систему для фабрик ИИ», он подчеркнул ее преобразующий потенциал.

анонс nvidia dynamo

«Покупайте больше, экономьте больше, зарабатывайте больше»

NVIDIA также представила два новых графических процессора: Blackwell Ultra GB300, усовершенствованную версию прошлогоднего Blackwell, а также чипсеты следующего поколения Vera Rubin и Rubin Ultra.

Blackwell Ultra GB300 поступит в продажу во второй половине этого года.

Выход фильма «Вера Рубин» запланирован на вторую половину следующего года.

Ожидается, что Rubin Ultra появится в конце 2027 года.

Кроме того, Хуан представил дорожную карту будущих чипов. Архитектура для поколения после Rubin получила название Feynman, ожидаемое в 2028 году. Название, вероятно, дано в честь известного физика-теоретика Ричарда Фейнмана.

Продолжая традицию NVIDIA, каждая архитектура графического процессора названа в честь выдающихся ученых: Blackwell — в честь статистика Дэвида Гарольда Блэквелла, а Rubin — в честь Веры Рубин, новаторского астрофизика, подтвердившего существование темной материи.

nvidi прокладывает дорогу

За последнее десятилетие NVIDIA выпустила 13 поколений архитектур GPU, в среднем по одному новому поколению в год. Среди них такие знаковые имена, как Tesla, Fermi, Kepler, Maxwell, Pascal, Turing, Ampere, Hopper и совсем недавно Rubin. Приверженность Хуанга закону масштабирования стала движущей силой этих инноваций.

Что касается производительности, Blackwell Ultra предлагает существенные улучшения по сравнению с Blackwell, включая увеличение объема памяти HBM3e с 192 ГБ до 288 ГБ. NVIDIA также сравнила Blackwell Ultra с чипом H100, выпущенным в 2022 году, отметив его способность обеспечивать в 1.5 раза большую производительность вывода FP4. Это означает значительное преимущество: кластер NVL72, работающий на модели DeepSeek-R1 671B, может предоставлять интерактивные ответы за 10 секунд по сравнению с 1.5 минутами с H100. Blackwell Ultra обрабатывает 1,000 токенов в секунду, что в 10 раз больше, чем у H100.

блэквелл ультра nvl72

NVIDIA также предложит одностоечную систему GB300 NVL72, включающую:

1.1 экзафлопс FP4,

20 ТБ памяти HBM,

40 ТБ «быстрой памяти»,

130 ТБ/с пропускной способности NVLink и

Скорость сети 14.4 ТБ/с.

Признавая ошеломляющую производительность Blackwell Ultra, Хуан пошутил о своих опасениях, что клиенты могут отказаться от покупки H100. Он с юмором назвал себя «главным разрушителем доходов», признав, что в ограниченных случаях чипсы Hopper «нормальны», но такие сценарии редки. Завершая свою классическую фразу, он заявил: «Покупайте больше, экономьте больше. Это даже лучше, чем это. Теперь, чем больше вы покупаете, тем больше вы зарабатываете».

Архитектура Rubin представляет собой новаторский шаг для NVIDIA. Дженсен Хуанг подчеркнул: «По сути, все, кроме стойки, совершенно новое».

Улучшенная производительность FP4: графические процессоры Rubin достигают 50 петафлопс, превосходя 20 петафлопс Blackwell. Rubin Ultra состоит из одного чипа с двумя взаимосвязанными графическими процессорами Rubin, обеспечивая производительность FP100 в 4 петафлопс — вдвое больше, чем у Rubin — и почти учетверяя объем памяти до 1 ТБ.

NVL576 Rubin Ultra Rack: обеспечивает 15 экзафлопс логического вывода FP4 и 5 экзафлопс обучения FP8, что в 14 раз превышает производительность стоек Blackwell Ultra.

система nvidia rubin

Хуан также объяснил интеграцию фотонной технологии для масштабирования систем, включив ее в кремниевые фотонные сетевые коммутаторы Spectrum-X и Quantum-X от NVIDIA. Эти инновации объединяют электронную и оптическую связь, позволяя фабрикам ИИ соединять миллионы графических процессоров на разных площадках, одновременно снижая потребление энергии и затраты.

фотонные сетевые коммутаторы

Коммутаторы исключительно эффективны: они обеспечивают в 3.5 раза большую энергоэффективность, в 63 раза большую целостность сигнала, в 10 раз большую устойчивость сети и более быстрое развертывание по сравнению с традиционными методами.

Компьютеры для эпохи ИИ

Расширяясь за пределы облачных чипов и центров обработки данных, NVIDIA выпустила настольные суперкомпьютеры ИИ на базе платформы NVIDIA Grace Blackwell. Эти устройства, предназначенные для разработчиков ИИ, исследователей, специалистов по данным и студентов, позволяют создавать прототипы, настраивать и делать выводы из больших моделей на уровне настольных компьютеров.

настольные суперкомпьютеры с искусственным интеллектом

Основные продукты включают в себя:

Суперкомпьютеры DGX: оснащены платформой NVIDIA Grace Blackwell для непревзойденных возможностей локального или облачного развертывания.

Станция DGX: высокопроизводительная рабочая станция, оснащенная Blackwell Ultra.

Блэквелл Ультра

Серия выводов Llama Nemotron: семейство моделей ИИ с открытым исходным кодом, предлагающее улучшенные многошаговые рассуждения, кодирование и принятие решений. Улучшения NVIDIA повышают точность на 20%, скорость вывода в 5 раз и эффективность эксплуатационных затрат. Ведущие компании, такие как Microsoft, SAP и Accenture, сотрудничают с NVIDIA для разработки новых моделей вывода.

Эра робототехники общего назначения

Дженсен Хуанг объявил роботов следующей отраслью стоимостью 10 триллионов долларов, решая глобальную нехватку рабочей силы, которая, как ожидается, достигнет 50 миллионов рабочих к концу века. NVIDIA представила Isaac GR00T N1, первую в мире открытую, полностью настраиваемую гуманоидную модель вывода и основы навыков, а также новую генерацию данных и фреймворк обучения робототехники. Это прокладывает путь к следующему рубежу в области ИИ.

Кроме того, NVIDIA выпустила модель Cosmos Foundation для разработки физического ИИ. Эта открытая, настраиваемая модель дает разработчикам беспрецедентный контроль над генерацией мира, создавая обширные и систематически бесконечные наборы данных посредством интеграции с Omniverse.

Хуан также представил Newton, физический движок с открытым исходным кодом для моделирования робототехники, разработанный совместно с Google DeepMind и Disney Research. В памятный момент миниатюрный робот по имени «Blue», который ранее появлялся на прошлогоднем GTC, снова появился на сцене, порадовав публику.

синий

Текущий путь NVIDIA был направлен на поиск приложений для ее графических процессоров, от прорывов в области ИИ с AlexNet более десяти лет назад до сегодняшнего внимания к робототехнике и физическому ИИ. Принесут ли плоды устремления NVIDIA на следующее десятилетие? Время покажет.

Оставьте комментарий

Наверх