Генеральный директор NVIDIA Дженсен Хуан представил самый маленький в мире суперкомпьютер с искусственным интеллектом

На недавней конференции CES Дженсен Хуанг, облаченный в новую куртку, объявил об официальном выпуске RTX 5090.

официальный релиз RTX 5090

Вот цены на графические процессоры серии 50.

RTX 5090: 1999 долларов США / RTX 5090 D: 16,499 XNUMX юаней

RTX 5080: 999 долл. США / 8,299 юаней

RTX 5070 Ti: 749 долларов

RTX 5070: 549 доллара

Вот цены на графические процессоры серии 50.

RTX 5090 и RTX 5080 поступят в продажу с 30 января, а RTX 5070 Ti и RTX 5070 появятся в феврале. Ноутбуки серии RTX 50 выйдут в марте.

Хуан также продемонстрировал новый суперчип для центров обработки данных — Grace Blackwell NVLink72, который оснащен 72 графическими процессорами Blackwell, 1.4 эксафлопс вычислительной мощности и 1.3 триллиона транзисторов, что позволит ему превзойти самые быстрые суперкомпьютеры в мире.

Хуан также продемонстрировал новый суперчип для центра обработки данных.
Грейс Блэквелл NVLink72

Кроме того, был представлен первый в мире настоящий настольный суперкомпьютер Project Digits по цене всего в 3000 долларов. С его помощью вы можете запускать большие модели с 200 миллиардами параметров прямо на своем столе, занимая место только в кофейной кружке, но обеспечивая вычислительную мощность уровня центра обработки данных.

проект-цифры

Project Digits, оснащенный новым суперчипом GB10 Grace Blackwell, может обеспечить производительность до 1 PFLOPS с точностью FP4.

Хуан предсказывает, что в будущем каждый специалист по данным, исследователь и студент будет иметь на своем столе персональный суперкомпьютер ИИ Project Digits. Эра ИИ будет принадлежать всем.

Оснащен новым суперчипом GB10 Grace Blackwell,

Во время дебюта RTX 5090 также была представлена ​​DLSS 4. После месяцев утечек и слухов новое поколение графических процессоров RTX Blackwell было официально представлено со следующими параметрами производительности:

  • 92 миллиарда транзисторов
  • 4000 TOPS вычислительной мощности ИИ
  • 380 TFLOPS производительности трассировки лучей
  • 125 TFLOPS производительности шейдеров
  • 32 ГБ памяти GDDR7
  • Пропускная способность памяти 1792 ГБ/с
  • До 21,760 XNUMX ядер CUDA

Стоит отметить, что вычислительная мощность искусственного интеллекта у RTX 5090 D составляет всего 2375 TOPS, но все равно вдвое больше, чем у 4090 D.

Стоит отметить, что вычислительная мощность искусственного интеллекта RTX 5090 D составляет всего 2375 TOPS, но все равно вдвое больше, чем у 4090 D.

Благодаря таким роскошным конфигурациям и поддержке архитектуры DLSS 4 и Blackwell производительность RTX 5090 в два раза выше, чем у RTX 4090. Однако это также означает, что у нее высокое энергопотребление: общая мощность видеокарты составляет 575 Вт, а рекомендуемая мощность блока питания — 1000 Вт.

Демонстрация показала, что запуск «Cyberpunk 2077» на RTX 5090 с включенным DLSS 4 достигал скорости 238 кадров в секунду по сравнению с всего лишь 106 кадрами в секунду на RTX 4090 с включенным DLSS 3.5.

Cyberpunk 2077 на RTX 5090

RTX 5080 в два раза быстрее RTX 4080, оснащен 16 ГБ памяти GDDR7, пропускной способностью памяти 960 ГБ/с и 10,752 5070 ядрами CUDA. RTX 16 Ti поставляется с 7 ГБ памяти GDDR896, пропускной способностью 8,960 ГБ/с и 5070 12 ядрами CUDA. RTX 7 имеет 672 ГБ памяти GDDR6,144, емкость 5070 ГБ/с и 549 4090 ядра CUDA. Дженсен Хуанг даже утверждал, что RTX 4, стоимостью XNUMX долларов, обеспечит производительность уровня RTX XNUMX благодаря DLSS XNUMX.

RTX 5090
RTX 5080
RTX 5070 Ti
RTX 5070

Кроме того, Хуан продемонстрировал графический процессор RTX Blackwell с демонстрацией рендеринга в реальном времени. Он заявил: «Новое поколение DLSS не только генерирует кадры, но и предсказывает будущее. Мы продвинули ИИ с GeForce, и теперь ИИ революционизирует GeForce». Новые нейронные шейдеры RTX от NVIDIA можно использовать для сжатия игровых текстур, а нейронные лица RTX используют генеративный ИИ для улучшения качества лиц. DLSS следующего поколения включает технологию многокадровой генерации, производя до трех дополнительных кадров на традиционный кадр, увеличивая частоту кадров до 8 раз. DLSS 4 также использует Transformers в приложениях реального времени для улучшения качества изображения, уменьшения двоения и добавления большей детализации в динамические сцены.

Хуан продемонстрировал графический процессор RTX Blackwell с помощью демонстрации рендеринга в реальном времени

Примечательно, что NVIDIA представила новый дизайн для серии RTX 50 Founders Edition, включающий два осевых вентилятора, 3D испарительную камеру и память GDDR7. Все графические процессоры серии RTX 50 поддерживают PCIe Gen 5 и оснащены интерфейсами DisplayPort 2.1b, способными выдавать разрешение 8K при частоте 165 Гц. Удивительно, но RTX 5090 Founders Edition — это двухслотовая видеокарта, что делает ее подходящей для корпусов малого форм-фактора — существенное изменение по сравнению с RTX 4090.

NVIDIA представила новый дизайн для серии RTX 50

Джим Фань, старший научный сотрудник NVIDIA, подчеркнул «суть» презентации Дженсена Хуанга о графических технологиях. Хуанг объяснил, что новые графические процессоры используют нейронные сети для генерации более 90% пикселей в играх. Традиционные алгоритмы трассировки лучей визуализируют только около 10% контента, что похоже на «грубый набросок», а генеративные модели заполняют оставшиеся детали в реальном времени. Дамы и господа, ИИ — это новое поколение графических технологий.

Джим Фан, старший научный сотрудник NVIDIA

После дебюта графических процессоров серии 50 Хуан отметил, что «закон масштабирования продолжает действовать»:

  • Первый закон масштабирования — это предварительное обучение.
  • Второй закон масштабирования — пост-тренинговый.
  • Третий закон масштабирования — это вычисление во время вывода.
После дебюта графических процессоров серии 50

Эти эволюционирующие законы масштабирования обуславливают огромный вычислительный спрос на ИИ. Удивительно, но около 15 суперкомпьютерных центров, включая центры Microsoft, Meta и xAI, уже оснащены графическими процессорами Blackwell.

Blackwell В полном объеме производства

Далее он упомянул агентов ИИ как идеальный пример масштабирования во время тестирования. Кроме того, он объявил о запуске серии базовых моделей с открытой лицензией под названием Llama Nemotron, которые обеспечивают высокую точность для различных задач агентов ИИ. Дженсен Хуанг заявил: «Агенты ИИ могут стать следующей отраслью робототехники, потенциально представляя собой многотриллионные возможности».

Агенты ИИ могут стать следующей отраслью робототехники
масштабирование времени тестирования агентного ИИ
nvidia лиама

Кроме того, NIM Blueprint от NVIDIA скоро будет доступен на ПК. С помощью этих чертежей разработчики могут создавать подкасты на основе PDF-документов и генерировать потрясающие изображения, руководствуясь 3D-сценами.

Проект NIM от NVIDIA

Суперкомпьютер ИИ настольного уровня, способный обрабатывать 4.05 триллиона параметров LLM

Перед завершением конференции CES Дженсен Хуанг представил революционный продукт — Project Digits — по-настоящему «настольный суперкомпьютер!» Он предназначен для разработчиков ИИ, специалистов по обработке данных, студентов и других специалистов, занимающихся работой с ИИ.

Суперкомпьютер ИИ настольного уровня, способный обрабатывать 4.05 триллиона параметров LLM

Этот компактный компьютер — самый маленький в мире суперкомпьютер с искусственным интеллектом, способный запускать модель с 200 миллиардами параметров, по цене 3,000 долларов США (примерно 21,986 XNUMX иен). Как продемонстрировал Хуанг, эта компактная настольная система обеспечивает огромную вычислительную мощность, занимая при этом минимальное пространство на столе — примерно ширину средней кофейной чашки и примерно половину ее высоты. Представьте себе миниатюрное устройство на вашем столе, которое обеспечивает вычислительную мощность уровня центра обработки данных. Это революционный прорыв, принесенный Project Digits!

Project Digits оснащен новым суперчипом GB10 Grace Blackwell, способным обеспечить производительность искусственного интеллекта до 1 PFLOPS (петафлопс) с точностью FP4.

Project Digits представляет новый суперчип GB10 Grace Blackwell

Этот мощный чип также включает в себя 20-ядерный процессор Grace на базе ARM. Центральный процессор и графический процессор соединены между собой с помощью технологии NVIDIA NVLink C2C для высокоскоростной связи. Каждый Project Digits оснащен 128 ГБ маломощной, высококонсистентной унифицированной памяти и до 4 ТБ хранилища NVME. С такой настройкой разработчики могут запускать модели до 200 миллиардов параметров прямо на своих настольных компьютерах. Более того, с помощью сетевого чипа ConnectX два суперкомпьютера Project Digits могут быть соединены между собой для запуска моделей до 4.05 триллиона параметров.

20-ядерный процессор Grace на базе ARM

Кроме того, Project Digits поставляется с предустановленной базовой операционной системой NVIDIA DGX (на основе Ubuntu Linux) и программным стеком NVIDIA AI, предоставляя разработчикам среду разработки AI plug-and-play. Разработчики могут быстро приступить к своим проектам AI прямо из коробки. Для миллионов разработчиков это будет инновационный продукт, который изменит правила игры, особенно для тех, кому нужны ресурсы облачных вычислений/центров обработки данных для запуска больших моделей AI. Этот настольный суперкомпьютер AI имеет широкий спектр приложений, включая эксперименты с моделями AI и создание прототипов, тонкую настройку и вывод моделей (для тестирования или оценки моделей), а также локальные службы вывода AI (например, чат-боты или помощники по анализу кода). Кроме того, специалисты по данным могут использовать систему для запуска NVIDIA RAPIDS, эффективно обрабатывая крупномасштабные рабочие процессы науки о данных прямо на своих рабочих столах.

Project Digits поставляется с предустановленной базовой операционной системой NVIDIA DGX.

Благодаря всесторонней поддержке стека технологий ИИ NVIDIA (фреймворки, инструменты, API) Project Digits становится идеальной платформой разработки для приложений периферийных вычислений, особенно в области робототехники и VLM (модели языка зрения). Появление Project Digits знаменует собой новую эру в персональных вычислениях ИИ. Он позволяет разработчикам по всему миру запускать крупномасштабные модели ИИ на своих настольных компьютерах, дополняя существующие ресурсы облачных вычислений и значительно повышая эффективность разработки ИИ.

Новая эра физического ИИ: модель мира с открытым исходным кодом

После введения интеллектуального ИИ Дженсен Хуанг теперь направил разговор в сторону «физического ИИ». По его мнению, «следующим рубежом для ИИ является физический ИИ». Принцип больших моделей заключается в генерации выходных данных по одному токену за раз на основе подсказок. Если этот контекст становится средой реального мира, а подсказка становится запросом, модель должна перейти от генерации «токенов контента» к генерации «токенов действий». Сейчас нам нужно создать эффективную «модель мира», а не языковые модели на основе GPT.

Модель мира с открытым исходным кодом

Эта «модель мира» должна понимать язык мира, понимать физическую динамику, такую ​​как гравитация и трение, осознавать геометрические и пространственные отношения, понимать причинно-следственные связи и признавать физическое постоянство.

На выставке CES Дженсен Хуан анонсировал революционную платформу разработки фундаментальных моделей мира под названием Cosmos, нацеленную на понимание физического мира. Обученная на 20-миллионном наборе данных, Cosmos может принимать текст, изображения и видео в качестве входных данных и генерировать состояния виртуального мира и видео. Платформа включает в себя несколько функциональных модулей, таких как модели диффузии, авторегрессионные модели и видеотокенизаторы, что позволяет разработчикам выбирать на основе конкретных потребностей. В частности, Дженсен Хуан анонсировал, что Cosmos в целом, включая Nano, Super и Ultra, будет иметь открытый исходный код и будет доступен для загрузки.

революционная мировая платформа разработки фундаментальной модели

Кроме того, Cosmos можно интегрировать с Omniverse для создания физически реалистичного мультигенератора, что означает, что все в мире физической симуляции может быть одновременно сгенерировано с помощью Cosmos.

Cosmos может быть интегрирован с Omniverse для создания физически реалистичного мультигенератора.

Дженсен Хуан также упомянул три типа компьютеров: DGX для обучения ИИ, AGX для развертывания ИИ и комбинация Omniverse и Cosmos. При соединении первых двух нам понадобится цифровой близнец. Хуан считает: «В будущем у каждой фабрики будет цифровой близнец, и вы сможете объединить Omniverse и Cosmos для создания многочисленных будущих сценариев».

Вселенная и Космос
симулятор мира
мегароботехнический объект цифровой двойник проект
вселенная
склад нового поколения

Автономные транспортные средства и роботы

Создание автономных транспортных средств, таких как роботы, требует этих трех компьютеров. На сегодняшний день, при 100 миллионах автомобилей, производимых ежегодно, и миллиардах автомобилей по всему миру, они постепенно станут высокоавтоматизированными и полностью автономными системами вождения. Дженсен Хуанг предсказывает, что это станет первой робототехнической отраслью стоимостью триллион долларов. Он также представил автомобильный процессор следующего поколения Thor, который может похвастаться 20-кратным увеличением производительности обработки по сравнению со своим предшественником Orin и служит универсальным процессором для роботов.

Автономные транспортные средства и роботы
Тор

Итак, что Omniverse и Cosmos могут сделать в контексте автономного вождения? Они могут генерировать бесконечные сценарии вождения, ускоряя разработку автономного вождения в сценариях с короткими хвостами и несобираемыми данными.

генерировать бесконечные сценарии вождения

После этого Дженсен Хуан вызвал всех роботов на сцену и объявил о наступлении «моменте ChatGPT для роботов общего назначения». Он заявил: «В настоящее время существует три типа роботов: интеллектуальный ИИ, автономные транспортные средства и машины. Если у нас будут технологии для решения этих трех проблем, то эра роботов уже близко». Завершая пресс-конференцию, Хуан подытожил, что сейчас в производстве находятся три новые системы Blackwell: суперкомпьютер Grace Blackwell NVLink72, основополагающая модель для физического ИИ, и три типа роботов, разработанных в области интеллектуального ИИ.

Дженсен Хуан вызвал всех роботов на сцену

Оставьте комментарий

Наверх