La visión de NVIDIA sobre la fotónica de silicio

El crecimiento explosivo actual de los modelos y cálculos de IA requiere operaciones paralelas en múltiples GPU, lo que ha llevado a un aumento en el ancho de banda de la interfaz entre las GPU. NVIDIA es el usuario más directo en el mercado de módulos ópticos de IA. Ha presentado varios requisitos y perspectivas para la fotónica integrada: bajo costo < 0.25 $/Gbps, bajo consumo de energía < 1.5 pJ/b, transmisión de larga distancia > 500 m, ancho de banda alto de fibra única > 0.8 Tbps, tamaño pequeño > 0.5 Tbps/ mm2 y alta confiabilidad < 100 FIT. La siguiente figura es su diagrama de arquitectura para fotónica integrada, que utiliza empaquetado 3D. Cada IO utiliza transmisión óptica y el chip eléctrico se invierte en el chip óptico, con el chip óptico, la GPU, los HBM y el interruptor empaquetados en el mismo interposer, comunicándose a través del interposer.

Diagrama de arquitectura para fotónica integrada

En un sistema integrado de alta densidad, es más compatible con MRM. DWDM Enlaces. Se basa principalmente en las siguientes consideraciones: se puede lograr una transmisión de 25-50 Gbps de un solo canal, el consumo de energía de un solo chip es <1 pJ/bit, el área promedio de un solo canal es tan pequeña como 50 um x 50 um y se puede lograr una gran capacidad a través de la integración de alta densidad.

Los principales desafíos de los sistemas DWDM basados ​​en MRM residen en el rendimiento de los dispositivos fotónicos de silicio, los láseres de longitudes de onda múltiples, el empaquetado integrado y la gestión y el control térmicos.

  • MRM

Lo primero que hay que solucionar en los sistemas DWDM es la diafonía de canales. El espectro del filtro de Lorentz tiene colas en otros canales, mientras que los fotodiodos y otros componentes son de banda ancha y no tienen selectividad de longitud de onda. Por lo tanto, en el sistema, la diafonía proviene de la influencia de la modulación de los canales adyacentes en el extremo transmisor, la diafonía del canal adyacente demux en el extremo receptor y la interferencia multitrayecto ISI causada por la modulación en anillo adyacente. MRM generalmente requiere pérdida equilibrada y ancho de banda de modulación. Una Q baja no sólo aumentará el ancho de banda, sino también el XT. Por lo tanto, el efecto se puede reducir aumentando el espacio entre canales o utilizando un filtro de anillo de orden superior.

  •  Láser

Normalmente, cada fibra óptica tiene entre 8 y 16 canales, que requieren longitudes de onda correspondientes. La potencia de salida de cada láser óptico acoplado a fibra es de ~5 mW. Teniendo en cuenta las pérdidas de acoplamiento, las pérdidas de los dispositivos pasivos y el consumo de energía, la eficiencia es de aproximadamente el 10 %, correspondiente a 2 pJ/b. La separación entre canales láser es de 100 a 200 GHz con una desviación de temperatura de ± 5 a 10 %, lo que tiene en cuenta tanto el bajo costo como el bajo nivel de ruido. Actualmente existen los siguientes tipos de láseres, y cuál adoptar depende de las capacidades de cada empresa.

Formas de láser

  • Embalaje 2.5D

La rejilla acoplada, la gran tolerancia de acoplamiento, el ancho de banda espectral bajo, la pérdida de 1 a 2 dB, generalmente el espaciado de 127 a 250 um, se pueden probar y empaquetar en un chip.

Acoplamiento de cara final, que requiere mayor precisión de acoplamiento, alto ancho de banda espectral y ayudas de fabricación adicionales (ranuras en V, metamateriales).

Ambas soluciones anteriores son aceptables, pero deben ser mecánicamente robustas. Lo mejor es utilizar EIC/PIC independientes para lograr el mejor proceso. El EIC está en el PIC y el PIC utiliza TSV para conectar el EIC y la comunicación del interposer. Lo principal es la gestión térmica de toda la estructura.

  • Simulación térmica

El rendimiento del dispositivo de los chips fotónicos de silicio es sensible al calor, y los chips ASIC y EIC son generadores de alto calor. La siguiente figura es un diagrama simulado, donde la potencia del ASIC se distribuye uniformemente en el chip, la potencia del EIC es constante y la temperatura del flujo de calor cambia directamente del ASIC al PIC y al EIC. Al agregar plástico directamente al PIC y ASIC, se puede lograr un buen aislamiento y el aumento de temperatura no excederá los 10K. Los cambios de temperatura del MRM en chip y del MRM adyacente a través de la película de monitoreo son 11 K y 0.7 K, respectivamente.

Deja un comentario

Ir al Inicio