AI計(jì)算的負(fù)載暴增為數(shù)據(jù)中心的能耗控制帶來(lái)了巨大的挑戰(zhàn),比如單卡功耗上千瓦的GPU,從風(fēng)冷改換至液冷的冷卻方案等等,就連光電互聯(lián)的功耗,也已經(jīng)成為棘手的問(wèn)題。單個(gè)光模塊的功耗并不算多,即便是隨著400G或800G的模塊逐一面世,其功耗最高也不過(guò)在30W左右。
但對(duì)于單個(gè)系統(tǒng)而言,其接入的光模塊數(shù)量遠(yuǎn)不止一個(gè),滿載的系統(tǒng)可能會(huì)接入數(shù)十個(gè)光模塊,功耗也會(huì)輕松突破千瓦,也就意味著光模塊的功耗很可能達(dá)到整個(gè)系統(tǒng)功耗的40%左右。即便進(jìn)一步提升芯片工藝,也很難將光模塊的整體功耗壓下去。
為了進(jìn)一步減少功耗和成本,廠商們開(kāi)始探索CPO和LPO這樣采用新式結(jié)構(gòu)的光模塊方案。然而CPO目前尚處于開(kāi)發(fā)早期階段,技術(shù)成熟度不高。且對(duì)于朝1.6T進(jìn)發(fā)的光模塊市場(chǎng)而言,已經(jīng)有了較為成熟的8*200G配置解決方案,足以有效滿足要求,而CPO更適合更高速的3.2T光模塊,所以需求上的缺失,使得CPO難以成為廠商們的首選。
去除DSP芯片的LPO光模塊
LPO光模塊全稱為線性驅(qū)動(dòng)的可插拔光模塊,是采用了低功耗設(shè)計(jì)的優(yōu)化版光模塊。在傳統(tǒng)的可插拔光模塊中,應(yīng)用于處理高速信號(hào)的DSP芯片助其實(shí)現(xiàn)了極低的誤碼率,但也帶來(lái)了極高的功耗。比如在一個(gè)400G的光模塊中,所用7nm工藝的DSP功耗在4W左右,這就占據(jù)了整個(gè)光模塊近乎一半的功耗,剩下的功耗再由驅(qū)動(dòng)、DRV和TIA來(lái)瓜分。
所以在LPO光模塊的設(shè)計(jì)中,就去除了DSP芯片以及用于時(shí)鐘數(shù)據(jù)恢復(fù)的CDR芯片,降低光模塊功耗的同時(shí),也因?yàn)闇p少了信號(hào)路徑中的數(shù)字運(yùn)算和決策,從而降低了時(shí)延。而且相對(duì)傳統(tǒng)光模塊而言,由于砍掉了DSP芯片,單個(gè)模組的成本也有所降低,畢竟DSP芯片的技術(shù)往往掌握在一些大廠手中,光模塊廠商想要自研DSP芯片并大規(guī)模量產(chǎn),存在較高的門檻。
相對(duì)CPO而言,LPO依然保留了可插拔的特性,所以在易維護(hù)性上,肯定是要高于一體化的CPO方案。如果CPO系統(tǒng)出現(xiàn)故障,很可能就要拆卸掉整個(gè)交換機(jī),比起隨時(shí)可以熱插拔的LPO系統(tǒng),替換和系統(tǒng)停機(jī)時(shí)間都被大大減少了。
但去除DSP芯片,采用線性驅(qū)動(dòng)的方式也不是毫無(wú)妥協(xié)的,因?yàn)樾盘?hào)補(bǔ)償性能縮水了,采用LPO光模塊的傳輸距離自然就受到了限制,所以應(yīng)用場(chǎng)景只限于50米以內(nèi)的連接,但對(duì)于目前數(shù)據(jù)中心內(nèi)部的服務(wù)器和交換機(jī)而言,這樣的傳輸距離已經(jīng)足以滿足需求。
目前400G乃至800G的LPO光模塊已經(jīng)在去年實(shí)現(xiàn)了小批量出貨,從預(yù)測(cè)來(lái)看,LPO光模塊可能會(huì)在今年年底迎來(lái)大規(guī)模商業(yè)出貨。
LPO后續(xù)開(kāi)發(fā)普及面臨的挑戰(zhàn)
即便LPO存在如此多的優(yōu)勢(shì),但從各大廠商的路線圖來(lái)看,LPO也并不是他們的唯一選擇。這是因?yàn)長(zhǎng)PO的后續(xù)開(kāi)發(fā)依然存在著不少阻力,且并不完全來(lái)自技術(shù)上。首先就是生態(tài)的問(wèn)題。
要想LPO能夠用在各大廠商的網(wǎng)絡(luò)設(shè)備中,LPO光模塊供應(yīng)商和交換機(jī)等網(wǎng)絡(luò)設(shè)備制造商之間就需要打通產(chǎn)品之間的互操作性。畢竟LPO并非CPO那樣的一體化方案,如果不能打通生態(tài)的話,對(duì)于數(shù)據(jù)中心的設(shè)備采購(gòu)而言會(huì)帶來(lái)阻礙,從而影響LPO光模塊的大規(guī)模普及。
其次,就是傳輸距離的問(wèn)題,盡管在目前絕大多數(shù)的數(shù)據(jù)中心中,50米左右的距離已經(jīng)足以滿足大多數(shù)服務(wù)器機(jī)柜和交換機(jī)之間的部署規(guī)劃,但未來(lái)隨著數(shù)據(jù)中心規(guī)模持續(xù)擴(kuò)張,LPO必須進(jìn)一步提到其可用傳輸距離。
最后就是電氣通道的設(shè)計(jì)問(wèn)題,目前的主流SerDes規(guī)范為112G,但隨著傳輸速率要求的逐步增長(zhǎng),很快就會(huì)突破至224G。而以目前的行業(yè)普遍觀點(diǎn)而言,LPO難以做到224G的SerDes傳輸,這就很可能會(huì)限制LPO在超高速光模塊上的設(shè)計(jì)和普及。
12家巨頭聯(lián)合定義LPO
對(duì)于傳統(tǒng)的光模塊來(lái)說(shuō),為了確保互操作性,靠的正是MSA多源協(xié)議標(biāo)準(zhǔn),MSA不僅定義了外形尺寸,還定義了光電接口,從而降低網(wǎng)絡(luò)搭建成本,防止市場(chǎng)被壟斷。傳統(tǒng)光模塊中的CSFP、QSFP、CFP、OSFP等,都是由此而來(lái)。
3月21日,來(lái)自網(wǎng)絡(luò)、半導(dǎo)體和光學(xué)領(lǐng)域的12大行業(yè)領(lǐng)頭羊聯(lián)合成立了LPO MSA(多源協(xié)議組織),用于定義支持互操作的LPO解決方案。LPO MSA成員包括光迅科技、AMD、Arista、博通、思科、新易盛、海思、旭創(chuàng)科技、英特爾、MACOM、英偉達(dá)和Semtech。
MSA的首個(gè)目標(biāo)是在鏈路兩端使用LPO光模塊實(shí)現(xiàn)進(jìn)一步優(yōu)化的光互聯(lián),LPO MSA的規(guī)范將從光電要求上給出定義,確保多個(gè)網(wǎng)絡(luò)設(shè)備和光模塊供應(yīng)商之間的互操作性。不僅如此,對(duì)于開(kāi)發(fā)者擔(dān)心的魯棒性問(wèn)題,LPO MSA也會(huì)開(kāi)發(fā)對(duì)應(yīng)的規(guī)范為這個(gè)光網(wǎng)絡(luò)系統(tǒng)提供同樣的魯棒性。
如此一來(lái),LPO缺少生態(tài)的問(wèn)題就得到了解決,任何交換機(jī)或NIC上的LPO MSA兼容接口,都可以與各家的LPO MSA兼容光模塊搭配使用。除了LPO-TO-LPO規(guī)范外,LPO MSA還進(jìn)一步制定了路線圖,用于解決LPO模塊與重定時(shí)模塊、線性接收光模塊(LRO)以及多模光纖(MMF)的連接問(wèn)題。
寫在最后
CPO的實(shí)現(xiàn)需要大量的光學(xué)技術(shù)儲(chǔ)備,而且其2.5D封裝要求也致使CPO很可能會(huì)對(duì)特定制造商廠商依賴,從而影響該技術(shù)的大規(guī)模應(yīng)用。為此,LPO很有可能成為未來(lái)光模塊的主流方案之一,如果網(wǎng)絡(luò)設(shè)備、光模塊和芯片廠商之間聯(lián)合推動(dòng)的話,甚至有可能占據(jù)一半以上的市場(chǎng)份額。
LPO MSA的成立無(wú)疑為L(zhǎng)PO光模塊解決了最大的落地難題,也側(cè)面說(shuō)明了設(shè)備廠商對(duì)于LPO光模塊的前景十分看好。隨著第一版規(guī)范預(yù)計(jì)于今年第三季度發(fā)布,相信LPO從明年開(kāi)始,會(huì)逐漸成為數(shù)據(jù)中心光模塊中的???。