Оптическое вычислительное соединение

Введение

На фоне быстрого развития искусственного интеллекта (ИИ) и машинного обучения (МО) спрос на более быструю, эффективную и масштабируемую вычислительную инфраструктуру стремительно растет. По мере того, как мы продолжаем расширять границы возможностей ИИ, возникают новые проблемы в передаче и обработке данных. Технология Optical Computing Interconnect (OCI) также стала прорывной технологией, которая, как ожидается, произведет революцию в том, как мы создаем и подключаем системы ИИ.

Задача: узкие места ввода/вывода в инфраструктуре ИИ

По мере того, как модели ИИ становятся все более сложными и большими, объем данных, которые необходимо передавать между вычислительными узлами, растет экспоненциально. Традиционные электрические соединения с трудом справляются с этими требованиями, создавая узкие места, которые ограничивают общую производительность систем ИИ.

Известные проблемы теперь решаются быстрее с помощью ИИ

Известные проблемы теперь решаются быстрее с помощью ИИ

Эта диаграмма наглядно показывает, как вычислительные сетевые соединения исторически отставали от меняющихся требований к пропускной способности приложений ИИ. По мере дальнейшего развития ИИ этот разрыв, как ожидается, будет увеличиваться, создавая срочную потребность в новых решениях.

Решение: фотоэлектронная интеграция и OCI

Для решения этих задач исследователи и инженеры обращаются к псветоэлектронной интеграции, в частности к технологии оптических вычислительных соединений (OCI). OCI использует свет для передачи данных, что имеет несколько ключевых преимуществ по сравнению с традиционными электрическими соединениями:

  • Более высокая пропускная способность
  • Меньшее энергопотребление при меньшей плотности
  • Нижняя задержка
  • Увеличенное расстояние передачи

Применение OCI в инфраструктуре ИИ

Технология OCI имеет два основных применения в инфраструктуре ИИ: вычислительная фабрика (кластер ИИ/МО) и декомпозиция ресурсов.

Вычислительная фабрика (кластер AI/ML)

В кластерах AI/ML OCI можно использовать для подключения серверов на базе CPU/GPU как в виде соединений «узел-узел» или в конфигурациях коммутируемой фабрики.

Это приложение предлагает несколько преимуществ:

  • Обеспечивает повышенную пропускную способность для более крупных кластеров.
  • Медные соединения увеличивают дальность передачи данных
  • Нижняя задержка
  • Пониженное энергопотребление
Применение OCI в кластерной вычислительной фабрике AI/ML

Применение OCI в кластерной вычислительной фабрике AI/ML

На этой схеме показано, как OCI используется для соединения нескольких узлов XPU (CPU/GPU) в кластере AI/ML, обеспечивая высокоскоростную связь с малой задержкой между вычислительными ресурсами.

Распределение ресурсов

OCI также позволяет декомпозировать ресурсы, что позволяет создавать более крупные общие пулы ресурсов на нескольких вычислительных узлах. Этот подход предлагает несколько преимуществ:

  • Освободите ресурсы от ограничений упаковки и слотов
  • Улучшение использования ресурсов и эффективности
  • Чувствительные к задержке соединения
  • Высокая плотность полосы пропускания
  • Низкое энергопотребление
Применение OCI при дезагрегации ресурсов

Применение OCI при дезагрегации ресурсов

На этой диаграмме показано, как OCI обеспечивает декомпозицию различных вычислительных ресурсов, таких как ЦП/XPU, память, ускорители и хранилище, что позволяет более гибко и эффективно использовать эти компоненты в инфраструктуре ИИ.

Подход Intel OCI

Intel находится в авангарде разработок OCI, используя свой опыт в области кремниевой фотоники и передовой корпусировки для создания масштабируемых решений для инфраструктуры ИИ.

Их подход сосредоточен на трех ключевых областях:

  • Интеграция большего количества фотоэлектронных функций на фотоэлектронных интегральных микросхемах (ФИС)
  • Интеграция PIC с лучшей в своем классе электронной интегральной схемой (EIC) с использованием передовой технологии корпусирования
  • Более тесная интеграция оптических чиплетов с хостом (XPU, коммутатор)
Чиплет Intel OCI-Gen1

Чиплет Intel OCI-Gen1

На этой схеме представлена ​​концепция чиплетов OCI компании Intel, которая тесно интегрирует xPU (центральный процессор или графический процессор) с модулем OCI для обеспечения оптической связи с высокой пропускной способностью и малой задержкой непосредственно с вычислительного блока.

OCI и будущее инфраструктуры ИИ

Поскольку ИИ продолжает развиваться, а спрос на более мощные вычислительные мощности растет, технология OCI будет играть ключевую роль в обеспечении следующего поколения инфраструктуры ИИ. Дорожная карта развития OCI от Intel включает:

  • Увеличить количество длин волн
  • Увеличить скорость линии
  • Увеличить количество оптических волокон
  • Использовать технологию поляризации

Эти достижения позволят продолжить улучшение пропускной способности, энергоэффективности и масштабируемости, что в конечном итоге позволит создавать более мощные и эффективные системы ИИ.

План масштабирования Intel OCI

План масштабирования Intel OCI

На этой диаграмме показан грандиозный план Intel по расширению технологии OCI, которая, как ожидается, значительно увеличит пропускную способность с 2 Тбит/с PCIe5/CXL до 16 Тбит/с UCIe/DWDM в будущих итерациях.

Подводя итог, можно сказать, что технология OCI представляет собой значительный шаг вперед в решении проблем взаимосвязей современной инфраструктуры ИИ. Используя мощь интегрированной фотоники, OCI, как ожидается, обеспечит пропускную способность, задержку и энергоэффективность, необходимые для приложений ИИ и МО следующего поколения. Поскольку такие компании, как Intel, продолжают инвестировать и развивать эту технологию, мы можем ожидать увидеть все более мощные и эффективные системы ИИ, которые будут продвигать возможности ИИ вперед.

Конкретная реализация технологии OCI Intel достигла значительного прогресса в реализации технологии OCI. Вот некоторые ключевые технические детали:

Фотонная интегральная схема (ФИС)

Компания Intel разработала полностью интегрированный чип PIC со скоростью 8 Тбит/с и следующими характеристиками:

  • Оптический интерфейс с плотным спектральным уплотнением каналов (DWDM)
  • 8 пар волокон x 8 длин волн x 64G, соответствует стандартам CW-WDM MSA
  • Пропускная способность 4 Тбит/с в каждом направлении
  • Стандартный одномодовый волоконный выход с низкой числовой апертурой и V-образной канавкой для пассивного выравнивания
Фотонная интегральная схема Intel 8 Тбит/с

 Фотонная интегральная схема Intel 8 Тбит/с

Эта высокоинтегрированная PIC содержит полную оптическую подсистему, включая встроенный лазерный источник, высокоэффективный микрокольцевой модулятор, германиевый фотодетектор и полупроводниковый оптический усилитель. Этот высокий уровень интеграции не только повышает производительность, но и снижает стоимость и энергопотребление.

Гетерогенная интеграция

Intel использует технологию гетерогенной интеграции на уровне пластины для интеграции материалов III-V (таких как InP) с кремниевыми оптоэлектронными устройствами. Этот подход имеет следующие преимущества:

  • Производительность: минимизация потерь на соединение
  • Надежность: надежность лазера < 0.1 FIT
  • Технологичность: от уровня пластины до заведомо годного кристалла (KGD)
  • Стоимость: не требуется дорогостоящая лазерная бэкэнд-система.
  • Масштабируемость: большое количество каналов, совместное использование ресурсов
  • Гибкость: возможность работы на нескольких длинах волн, резервное копирование
гетерогенная интеграция III-V лазера/SOA

гетерогенная интеграция III-V лазера/SOA

Эта технология гетерогенной интеграции была продемонстрирована в более чем 8 миллионах микросхем PIC, развернутых у поставщиков гипермасштабных облачных услуг, содержащих более 32 миллионов лазеров на кристалле.

OCI-чиплет

OCI Chiplet от Intel — это стек кристаллов, который обеспечивает оптический ввод-вывод с использованием технологии кремниевой фотоники Intel и может быть упакован вместе с xPU. Основные параметры первого поколения OCI chiplet включают:

  • Интерфейс хоста: интерфейс PCIe gen5 SerDes
  • Оптическая сторона: 8 волокон x 8 длин волн x 32G NRZ, плотное мультиплексирование с разделением по длине волны по одномодовому волокну
  • Общая пропускная способность: 4 Тбит/с (2 Тбит/с в каждую сторону)
  • Коэффициент сквозных битовых ошибок: < 1E-12

  • Энергоэффективность: ~5 пДж/бит

Концептуальный процессор Intel с совместно упакованным OCI, продемонстрированный на OFC 2024, продемонстрировал практическое применение этой технологии. Демонстрация показала, что только с точки зрения оптических соединений технология OCI обеспечивает более чем 3-кратное увеличение мощности и 5-кратное увеличение плотности по сравнению со сменными модулями.

Будущее развитие технологии OCI

У Intel есть четкая дорожная карта развития технологии OCI, включающая следующие ключевые направления:

  • Расширение количества длин волн: с нынешних 8 до 16 длин волн и даже больше.
  • Увеличенная скорость линии: с 32G NRZ до 64G PAM4, а в будущем может достичь 128G и выше.
  • Увеличение количества оптических волокон: увеличение количества оптических волокон при сохранении миниатюризации, тем самым увеличение общей пропускной способности.
  • Использование технологии поляризации: дальнейшее увеличение плотности полосы пропускания за счет поляризационного мультиплексирования.

Эти достижения позволят технологии OCI поддерживать приложения искусственного интеллекта и высокопроизводительных вычислений с более высокой пропускной способностью, меньшей задержкой и большей энергоэффективностью.

Заключение

Технология OCI представляет собой значительный прорыв в межсоединениях инфраструктуры ИИ. Используя преимущества интегрированной оптоэлектроники, OCI обеспечивает высокую пропускную способность, низкую задержку и высокую энергоэффективность, необходимые для приложений ИИ и МО следующего поколения. Поскольку такие компании, как Intel, продолжают инвестировать и развивать эту технологию, мы можем ожидать появления более мощных и эффективных систем ИИ, что будет способствовать дальнейшему прогрессу в области искусственного интеллекта.

Технология OCI не только решает проблемы, с которыми сталкивается текущая инфраструктура ИИ, но и предоставляет масштабируемое решение для будущего развития. Благодаря постоянным технологическим инновациям и отраслевому сотрудничеству OCI имеет потенциал стать ключевой технологией, поддерживающей следующее поколение ИИ и высокопроизводительной вычислительной инфраструктуры.

В этой статье подробно излагаются принципы, приложения и перспективы развития технологии OCI, и мы надеемся предоставить читателям всестороннее понимание этой новой технологии. По мере развития технологий можно ожидать, что OCI будет играть все более важную роль в развитии областей ИИ и высокопроизводительных вычислений.

Оставьте комментарий

Наверх