自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

CPO已死,AIGC也難救

企業(yè)動態(tài)
兩到三年的時間尺度內(nèi)技術總是被高估,就像CPO描繪了一個虛幻的圖景,最后一直沒有真正商用。而在十年的尺度內(nèi)技術進步總是被低估,也許等不到CPO產(chǎn)品與生態(tài)的成熟,新的技術就會取而代之。

上周筆者參觀了上海MWC大會,看到CPO交換機重新被抬上了展臺桌面。作為一名硅光工程師兼通信行業(yè)從業(yè)者,不禁感慨昔日的“小甜甜”、現(xiàn)在的“牛夫人”也有重新上臺的一天。早在2022年,CPO(Co-Packaged Optics)概念股也曾在技術圈子里掀起層層浪花,時至今日聲音日漸趨微,漸漸淡出公眾視線。今天就來聊聊這個過氣網(wǎng)紅,盤點下CPO淡出公眾視野背后的原因。

CPO本質(zhì)為光電高度集成,理論上成本/功耗收益明顯

說起CPO,就得提到可插拔光模塊。自從數(shù)據(jù)中心產(chǎn)業(yè)蓬勃發(fā)展,可插拔光模塊和數(shù)據(jù)中心交換機就開始了長相廝守,相互成就,一路從100G發(fā)展到400G,直至今日的800G。

交換機和光模塊(圖片來源于網(wǎng)絡,僅供示意)

交換機內(nèi)部有一顆交換芯片,用于數(shù)據(jù)的轉(zhuǎn)發(fā)。交換芯片被封裝在基板上,并通過PCB上的走線連接到光模塊籠子。光模塊籠子從外部看就是一個插口,可用于插入光模塊,這也是可插拔光模塊的由來。

400G及以上速率的光模塊主要有兩個核心部件:

一個是光電轉(zhuǎn)換單元,通過激光器將電信息轉(zhuǎn)換為光信息后,經(jīng)過光纖傳輸出去。 CPO交換機中的光電轉(zhuǎn)化單元也被稱為光引擎(Optics engine)。所謂光引擎就是通過硅光集成技術將傳統(tǒng)光模塊中的光電轉(zhuǎn)換單元小型化,集成化。

另一個是光數(shù)字處理器(Digital Signal Processor,DSP)芯片, DSP具有非常強的信號均衡能力,能夠降低噪聲,提升信噪比。但DSP是光模塊部件中的功耗大戶,且價格并不便宜。

傳統(tǒng)交換機與可插拔光模塊

CPO技術通過集成方法,將光引擎和交換芯片放置在同一個基板上,通過光纖連接到交換機面板。交換芯片和光引擎緊鄰封裝在一起,可以極大地減少信號的傳輸距離,從而顯著降低功耗,提高信號完整性,減少延遲,同時縮小了體積。

CPO技術聽起來簡直就是天頂星科技,格調(diào)高,非常戳人。這套概念讓當時業(yè)內(nèi)的硅光從業(yè)者狠狠振奮了一把。畢竟CPO是把硅光引擎和交換芯片集成在一起,用上了硅光技術對于硅光從業(yè)者來說就是重大利好,畢竟誰不希望自己從事的行業(yè)代表著未來方向呢。

CPO交換機示意圖

封裝在一個基板上的交換芯片和多個光引擎(圖片來源于網(wǎng)絡,僅供示意)

下圖是一個業(yè)界典型的CPO系統(tǒng)demo,目前沒有正式部署,其搭載使用8個通道的FR4 硅光引擎,單個硅光引擎可實現(xiàn)6.4T的傳輸容量,配套了64通道,8顆那就是51.2T的容量,甚至使用了TSV(Through Silicon Via),interposer,硅光Flipchip等先進的芯片封裝技術。某廠商宣稱,使用CPO系統(tǒng)可以將功耗降低30%。

某廠商CPO:左圖為交換芯片與光引擎共封裝,右圖為光引擎中硅光芯片(圖片來源于網(wǎng)絡,僅供示意)

單看這個51.2T 的CPO是非?;H说?,彼時業(yè)界積極跟進,各路神仙下場施展神通,2022年各大展會,論壇如果不講講CPO都不好意思跟同行交流。業(yè)界各方也是紛紛開啟腦洞,大膽暢想。早在2022年,業(yè)界已經(jīng)大膽預測CPO技術下一跳就是Optical I/O技術了,把光引擎的外殼拿掉,交換芯片做成一個更為緊湊的整體,提升集成度,進一步降低功耗(見下圖)。但設想畢竟只是設想,CPO在市場推廣上遭受了滑鐵盧。

CPO和光I/O(圖片來源于網(wǎng)絡,僅供示意)

CPO熱潮曇花一現(xiàn),可靠性、運維有致命缺陷,LPO 異軍突起延續(xù)可插拔形態(tài)

正當CPO一路高歌猛進時,LPO橫空出世,迅速替代CPO成為行業(yè)新寵。標志性事件為騰訊2022年底聯(lián)合英偉達在開放數(shù)據(jù)中心論壇(ODCC)發(fā)表《112G線性互聯(lián)解決方案白皮書》。LPO全稱是linear pluggable optics,線性可插拔光模塊,是傳統(tǒng)可插拔光模塊的一個變種。

下圖比較直觀地說明了傳統(tǒng)可插拔,LPO可插拔光模塊,CPO光電共封裝的區(qū)別。

傳統(tǒng)可插拔光模塊系統(tǒng)中,交換芯片和可插拔光模塊中都有數(shù)字處理功能,分別是DSP1和DSP2。CPO系統(tǒng)則是將光電轉(zhuǎn)換單元轉(zhuǎn)移到了交換芯片附近,僅保留交換芯片上的數(shù)字處理能力。與傳統(tǒng)可插拔光模塊相比,LPO可插拔光模塊去除了內(nèi)部的DSP芯片,使得光模塊的價格和功耗顯著降低,但依然維持著可插拔模塊運維簡單的優(yōu)點。

可插拔,CPO,LPO 區(qū)別

由于LPO把可插拔模塊的價格打了下來,功耗也降低了,收益明顯,并且模塊還是“可插拔”形態(tài),還是那個陪伴交換機一路走來的“賢伉儷”。很多互聯(lián)網(wǎng)廠商一看,還是原來的配方,價格功耗都降低了,最關鍵的是,可插拔光模塊的運維手段還是原來的路子,不用擔心CPO最致命的可靠性和隨之而來的維護問題。可以想象下,如果CPO交換機任意一個光引擎壞了,整個CPO交換機就算報廢了,對系統(tǒng)可靠性有極高的要求。

首先在可靠性方面,光元件的可靠性普遍低于電學元件。另外,CPO系統(tǒng)中需要將多個光引擎和交換芯片合封,散熱肯定不如可插拔架構。據(jù)有效統(tǒng)計,按10度法則,環(huán)境溫度每升高10度,硬件/模塊失效率就增加1倍。反觀CPO廠商,至今仍沒有發(fā)布一定量級的可靠性驗證結(jié)果,而大多數(shù)客戶沒有動力去針對CPO做大規(guī)模的試點,可靠性的質(zhì)疑聲一直存在。

其次,如果無法保障CPO的可靠性,那么簡單方便的運維手段也可以作為一種補償措施。然而CPO交換機運維困難的嚴重缺陷遲遲未被解決,出了問題只能整機更換,大大增加了運維的難度,影響運維效率。而傳統(tǒng)可插拔光模塊或者LPO光模塊可以直接替換,運維簡單。

第三則是標準化,不同數(shù)據(jù)中心、計算中心的框架都不盡相同,各個廠家CPO的技術方案也不大一致。如何進一步做到標準化,能夠互聯(lián)互通,才是CPO廠商迫切需要回答的問題。因此直到現(xiàn)在也沒有看到CPO真正的商業(yè)落地。

這里引用下谷歌的觀點,除了可靠性和可運維性之外,諸如加工良率、供應鏈安全、供電、后續(xù)的演進迭代等等技術和商務層面的問題也非常尖銳。

Google 對于CPO技術的觀點

這下無論是設備廠商還是模塊廠商迅速達成一致,CPO一時間被打入冷宮,只能看著LPO走上臺前,萬人追捧。

ChatGPT爆火點燃了全球AI算力建設的熱情。由于CPO功耗低的優(yōu)點,借助智算的風口,有重出江湖之勢。乍一看似乎有理,但仔細分析更不可行。在AIGC大規(guī)模組網(wǎng)中,成千上萬張卡協(xié)同計算一個訓練任務,一旦一臺CPO交換機故障,需要更換整個CPO網(wǎng)絡節(jié)點,同時需要重新連線,嚴重影響了大模型的訓練效率,須知現(xiàn)在AI訓練時間無比珍貴。

與CPO的運維災難相比,使用可插拔模塊+交換機的組合,走分布路線,運維簡單,符合傳統(tǒng)運維習慣,單點故障替換簡單,僅此一點就決定了智算的主流技術路線,業(yè)界OTT等主流AI玩家仍然延續(xù)“老路子”,即使是北美這些大戶也并沒有部署CPO。

總結(jié)

CPO雖然理論先進,但實際應用起來這幾個問題就是攔路虎, 特別是在要求大規(guī)模組網(wǎng)的AIGC領域,系統(tǒng)的可靠性,以及可運維性都是非常重要的考量,所以在AIGC市場,廠商還是用腳投票選擇了可插拔模塊路線,LPO和傳統(tǒng)DSP的可插拔光模塊未來一定是業(yè)界主流。

最后的最后,再啰嗦一句:兩到三年的時間尺度內(nèi)技術總是被高估,就像CPO描繪了一個虛幻的圖景,最后一直沒有真正商用。而在十年的尺度內(nèi)技術進步總是被低估,也許等不到CPO產(chǎn)品與生態(tài)的成熟,新的技術就會取而代之。

責任編輯:張誠
相關推薦

2022-02-25 10:46:46

搜索推薦Meta數(shù)據(jù)安全

2011-01-07 10:18:28

RSSWeb

2011-05-11 09:01:29

面向?qū)ο蠹夹g函數(shù)式語言

2023-02-06 07:37:29

Java編程語言

2022-09-15 10:44:42

SidecarIstioeBPFizer

2014-01-06 09:36:53

IT部門BYODBYOA

2012-02-20 10:12:09

Java

2014-03-04 18:12:39

Windows XPWindows 8

2021-01-19 10:58:15

漏洞管理漏洞數(shù)據(jù)泄露

2011-12-07 10:20:19

Email新聞

2015-08-31 10:59:22

2013-01-31 17:23:20

RIM黑莓BB10

2021-04-19 08:17:42

MesosKubernetesLinux

2020-02-29 15:18:10

DevOpsNoOps運維

2024-09-03 09:31:59

2020-02-19 11:35:21

iPhone越獲PP助手

2023-11-15 15:37:21

大模型人工智能

2020-12-15 10:40:14

CentOSRockyLinux

2021-04-27 06:32:23

ERP中臺代碼

2010-05-05 09:46:03

NVIDIA摩爾定律
點贊
收藏

51CTO技術棧公眾號