隨著人工智能(AI)技術的迅猛發(fā)展,對數(shù)據(jù)處理和傳輸?shù)男枨笕找嬖黾?,網(wǎng)絡基礎設施也必須隨之升級。Marvell Teralynx 10 作為一款51.2Tbps的交換機,正是為了滿足這些高要求而誕生的。本文將深入探討這款革命性的交換機內(nèi)部結(jié)構(gòu)和技術細節(jié),揭示其在未來AI集群中的重要作用。
2021年,Marvell收購了Innovium,這家公司以其Teralynx 7交換機聞名,后者具備32個400GbE端口和12.8Tbps的吞吐量。Innovium是當時最成功的初創(chuàng)公司之一,成功打入了超大規(guī)模數(shù)據(jù)中心市場。
相比之下,英特爾在收購Barefoot Networks后未能達到預期效果,反而在2022年宣布退出以太網(wǎng)交換業(yè)務。博通在商用交換機芯片市場占據(jù)了重要地位,而Innovium/Marvell則在超大規(guī)模數(shù)據(jù)中心取得了顯著進展。
Part 1 Marvell Teralynx 10 的技術細節(jié)
外部結(jié)構(gòu)
從交換機的正面來看,Teralynx 10采用了一個2U機箱,正面布滿了64個OSFP(Octal Small Form-factor Pluggable)端口,每個端口支持800Gbps的速率。每個接口都裝有OSFP光學器件,這些器件比傳統(tǒng)的QSFP+/QSFP28光學器件更大,并且配備了集成散熱器,從而提高了散熱效率。
在交換機的右側(cè),可以看到管理和控制臺端口,而在背面則是風扇和電源模塊。為了支持這些高功率的光學器件和交換機芯片,Teralynx 10的電源額定功率超過2kW。
內(nèi)部結(jié)構(gòu)
打開交換機,我們首先看到的是大型散熱器,覆蓋了Teralynx 10的核心芯片。這款芯片采用了5nm工藝,功耗高達500W。散熱器的設計考慮到了芯片的高熱量輸出,確保在高負載下仍能保持穩(wěn)定運行。
在散熱器下方是交換機的PCB板,這里布局了32個OSFP籠子,整個交換機內(nèi)部共有64個OSFP籠子分布在兩個塊中。Teralynx 10的交換芯片位于OSFP籠子的后方,這個芯片是整個系統(tǒng)的核心,負責處理所有的數(shù)據(jù)傳輸任務。
交換機還配備了基于Marvell Octeon的管理控制器,并且主配電板上還安裝了一個M.2 SSD,用于存儲管理數(shù)據(jù)。為了便于診斷和維護,交換機內(nèi)部還留有PCIe插槽和10Gbase-T管理端口。
Part 2 冷卻系統(tǒng)和產(chǎn)品迭代展望
Teralynx 10的冷卻系統(tǒng)設計相對簡單,但高效。機箱后部安裝了四個風扇模塊,這些風扇能夠提供足夠的氣流,確保芯片和光學器件在高負載下也能保持低溫運行。
在Marvell的實驗室中,Teralynx 10被放置在機架中,并與Keysight Ixia AresONE 800GbE測試設備連接。這些設備能夠模擬800GbE的高負載網(wǎng)絡流量,驗證交換機在實際使用中的性能。
在測試中,Teralynx 10表現(xiàn)出色,能夠在多個端口上同時處理高帶寬數(shù)據(jù)流,線路速率達到99.3%。
隨著AI技術的發(fā)展,數(shù)據(jù)中心對網(wǎng)絡交換機的性能要求將越來越高。Marvell Teralynx 10憑借其51.2Tbps的高吞吐量和64個800GbE端口,完美契合了未來AI集群的需求。其先進的芯片工藝、強大的散熱系統(tǒng)和靈活的管理控制器,確保了在高負載下的穩(wěn)定性和高效性。
小結(jié)
Marvell Teralynx 10不僅是一款技術先進的交換機,更是未來數(shù)據(jù)中心和AI集群的核心組件。隨著更多新技術的引入,這款交換機將在未來幾年內(nèi)發(fā)揮越來越重要的作用。