Matthew Traverso von Marvell präsentierte einen Vortrag mit dem Titel „Fortschritte bei CPO und Ökosystem“ und analysierte systematisch die Fortschritte der wichtigsten Chiphersteller im Bereich CPO auf der OFC 2024. Nachfolgend finden Sie relevante Informationen, die auf Grundlage des Berichts zusammengestellt wurden.
AMD und Ranovus
Xilinx arbeitet seit vielen Jahren mit Ranovus zusammen und hat auf der OFC2023 ein System vorgestellt, das Ranovus‘ 800G-Direktantriebs-Silizium-Photonik-Engine mit AMDs FPGA-Chip (Xilinx Versal ACAP) kombiniert. Ranovus ist seit vielen Jahren im CPO-Bereich tätig, dessen wichtigste technische Highlights die Verwendung von Quantenpunktlasern, Mikroringmodulatoren usw. sind. Ranovus hat vor kurzem auch eine CPO-bezogene Zusammenarbeit mit MediaTek begonnen und seine neueste Generation der 6.4-Tbit/s-Lichtmaschine herausgebracht.
AMD/Ranovus
Broadcom
Broadcom hat dieses Jahr auf der OFC ein 51.2T-Switch-System mit CPO vorgestellt. Das System enthält acht 6.4T FR4-Lichtmaschinen. Eine einzelne optische Maschine enthält 64 Kanäle mit PIC- und EIC-Chips. Der Treiber/TIA verwendet CMOS-Technologie mit einer Einzelkanal-Signalrate von 100 Gbit/s. Der PIC integriert Mux/DeMux auf dem Chip und arbeitet mit der CWDM4-Wellenlänge. Die Lichtmaschine verwendet eine FOWLP-Verpackungslösung, die TSV-Lösung wurde zuvor übernommen, was hauptsächlich auf Kosten- und Ertragsüberlegungen zurückzuführen sein könnte. Broadcom hat sich mit Tencent zusammengetan, um Netzwerk-Switches mit CPO in seinen Rechenzentren einzusetzen.
CPO von Broadcom
Cisco
Cisco stellte seinen CPO-basierten 25.6TSwitch-Prototyp vor. Das System enthält acht 3.2T Silizium-Photonik-Engines, von denen jede acht 400G-FR4 Silizium-Photonik-Chips mit einer Einzelkanalrate von 100 Gbit/s verwendet, einen Modulator vom Typ SISCAP mit integriertem Mux/DeMux auf dem Chip verwendet.
Cisco
IBM
IBM ist insofern einzigartig, als dass es keine Silizium-Photonik-Lösung verwendet, sondern stattdessen mit Finisar zusammengearbeitet hat, um ein VCSEL-basiertes CPO-System zu entwickeln. Das System enthält 4 PD-Chips und 4 VCSEL-Chips. Aus Gründen der Systemzuverlässigkeit ist jeder VCSEL mit einem redundanten VCSEL konfiguriert. Die Einzelkanal-Signalrate beträgt 56G NRZ mit 16 Kanälen und einer Gesamtbandbreite von 896 Gbps. Die Lichtmaschine kann per LGA oder Schweißen mit dem Substrat verbunden werden.
IBM
Intel
Intel ist seit vielen Jahren intensiv im Bereich der Siliziumphotonik tätig und konzentrierte sich zuvor auf die Forschung und Entwicklung von steckbaren optischen Transceivern und Mikroringmodulatortechnologie für die Siliziumphotonik. Seit 2020 hat das Unternehmen begonnen, im CPO-Bereich zu arbeiten, wobei es sich auf Optical Compute Interconnection (OCI) konzentriert und seine einzigartige Siliziumphotonik-Prozessplattform verwendet, um ein CPO-System auf Basis von Mikroringmodulatoren zu entwickeln. Auf der OFC 2024 demonstrierte das Unternehmen seine neuesten OCI-Fortschritte. Jeder PIC verfügt über 64 optische Kanäle, die Signalrate einer einzelnen Verbindung beträgt 32 Gbit/s, die Gesamtsignalbandbreite beträgt 2 Tbit/s (bidirektionale Bandbreite beträgt 4 Tbit/s) und die Link-Bitfehlerrate beträgt weniger als 1e-12. Darüber hinaus hat Intel einen einzigartigen steckbaren optischen Anschluss entwickelt, mit dem PIC-Chips vor dem Verpacken geprüft werden können, um die Ausbeute zu verbessern, und so den Grundstein für die Massenproduktion von CPO im großen Maßstab gelegt.
Intel
Marvell
Nach der Übernahme von Inphi hat Marvell seine F&E-Kapazitäten in den Bereichen optische Kommunikation und Datenzentren erheblich erweitert. Marvell hat dieses Jahr auf der OFC die neueste 6.4T 3D-gepackte Silizium-Photonik-Engine vorgestellt, die 32 Kanäle mit einer Einzelkanal-Signalrate von 200 Gbps umfasst.
Marvell
Nvidia
Als Marktführer im GPU-Bereich hat Nvidia auch die Siliziumphotonik-CPO-Technologie entwickelt. Auf der 2020GTC-Konferenz demonstrierte Nvidia ein Systemarchitekturdiagramm, das GPU- und Switch-Chips über CPO verbindet. Darüber hinaus arbeitet Nvidia auch mit TSMC, Ayar Labs und anderen Unternehmen an der Entwicklung der CPO-Technologie.
Silizium-Photonik-CPO-Technologie
TSMC
TSMC begann 2017 mit der Zusammenarbeit mit Luxtera und entwickelte eine 12-Zoll-Silizium-Photonik-Prozessplattform auf einem 65-nm-Knoten. Anschließend führte das Unternehmen fortschrittliche Verpackungen ein und brachte die COUPE 1.0/2.0-Plattform auf den Markt. TSMC veröffentlichte kürzlich seine Roadmap im CPO-Bereich, die den Plan umfasst, bis 6.4 eine 2025-Tbit/s-Lichtmaschine zu erreichen und eine 12.8-Tbit/s-Optikmaschine weiterzuentwickeln, die für die XPU-Verbindung verwendet wird.
12-Zoll-Silizium-Photonik-Plattform
Die folgende Tabelle fasst die CPO-Technologien der oben genannten großen Hersteller zusammen. Mit Ausnahme von Broadcom sind die Lösungen anderer Unternehmen derzeit nicht streng CPO, sondern eher NPO. Die von ihnen verwendeten optischen Motoren sind über eine elektrische Buchse mit dem Substrat verbunden und bis zu einem gewissen Grad austauschbar. Darüber hinaus haben sich die meisten Hersteller für die Lösung mit einer externen Lichtquelle entschieden, um den Einfluss der Wärmeableitung des internen Hochleistungschips auf die Laserleistung zu vermeiden.
Zusammenfassung der Demonstrationen
Die Hauptantriebskraft der CPO-Technologie ist die Reduzierung des Energieverbrauchs. Da sich die optische Einheit sehr nahe am ASIC-Chip befindet, wird der Verbindungsverlust reduziert und es ist kein Retimer-Chip erforderlich, um das Signal zwischen den beiden auszugleichen, was zu einer Reduzierung des Energieverbrauchs um etwa 30 % führt. Darüber hinaus verbessert die CPO-Technologie auch die Bandbreitendichte des Systems.
Vergleich der mit Laser angesetzten Neutaktung
Zweifel an der CPO-Technologie und dem Geschäftsmodell gab es schon immer. Die folgende Abbildung stammt aus der PPT von Andy mit Arista. Verglichen mit herkömmlichen steckbaren optischen Transceivern erfordert die Forschung und Entwicklung der CPO-Technologie eine intensive Zusammenarbeit mit den wichtigsten Switch-/XPU-Herstellern. Das Wort haben hauptsächlich die Switch-Hersteller, was kleinen Unternehmen gegenüber nicht sehr freundlich ist. Außerdem wird das CPO-Modul seit langem wegen seiner Zuverlässigkeit, Testbarkeit und Austauschbarkeit kritisiert, was gelöst werden muss. Da der ASIC-Chip zusammen mit der CPO-Lichtmaschine verpackt wird, ist der Preis des ASIC-Chips sehr hoch. Wie kann die CPO-Lichtmaschine bei einem Ausfall schnell repariert oder ersetzt werden? Das Versiegeln optoelektronischer Chips zusammen stellt auch eine Herausforderung für die Wärmeableitung des Systems dar. Die Einführung fortschrittlicher Verpackungstechnologien (TSV, FOWLP usw.) hat einerseits die F&E-Kosten erhöht und die Entwicklungszyklen verlängert, andererseits aber auch Herausforderungen hinsichtlich der Ausbeute mit sich gebracht.
Die Probleme, die CPO nicht löst
Als Branchen-Hotspot hat die CPO-Technologie große Aufmerksamkeit in der Branche erhalten, und auch große Hersteller schmieden Pläne. Die Debatte zwischen dieser Technologie und steckbaren optischen Transceivern wird kurzfristig weitergehen. Vor dem Hintergrund der optischen KI-Verbindung könnte die Branche strengere Anforderungen an die Zuverlässigkeit optischer Transceiver stellen. Obwohl die CPO-Technologie Vorteile in Bezug auf Stromverbrauch und Bandbreitendichte bietet, bleibt zu diskutieren, ob sie kommerziell weit verbreitet sein und die Position steckbarer optischer Transceiver erschüttern kann. Im Vergleich dazu wird die optische IO-Technologie steckbaren optischen Transceivern keinen Marktanteil wegnehmen. Sie kann die Probleme herkömmlicher elektrischer IO in Bezug auf Stromverbrauch und Bandbreite lösen, sodass ihre Förderung möglicherweise reibungsloser verläuft.