Iccsz訊 光網(wǎng)絡非常昂貴,像微軟這一云服務提供商,在不考慮購買或租用光纖成本的前提下,每提升100Gbps的速度都需花費數(shù)萬美元。僅微軟美國骨干網(wǎng)就需要在數(shù)千英里的光纖上傳播覆蓋35個城市的每秒數(shù)百TB的帶寬,在全球范圍內(nèi),為云服務構建和互聯(lián)數(shù)據(jù)中心網(wǎng)絡需要數(shù)億美元的資金。隨著帶寬需求的增加,光網(wǎng)絡成本必須降低。
云運營商所需的光纖網(wǎng)絡比典型的一級運營商的需求更加簡單,對于只承載基于數(shù)據(jù)包的流量的點對點網(wǎng)段,容量和一致性傳輸比網(wǎng)狀連接或管理更重要。另一方面,微軟骨干網(wǎng)上的網(wǎng)絡流量十分混亂,Office 365、Azure、OneDrive(云存儲)、Bing以及一系列其他工作負載需要進行優(yōu)化。企業(yè)營業(yè)程序需要接近完美的可用性、高容量并且能夠靈活地跟上不可預測的用戶需求。在Azure數(shù)據(jù)中心之間復制存儲會產(chǎn)生大量流量,但可以加以計劃并圍繞更高優(yōu)先級的流量進行調(diào)度。
Azure的網(wǎng)絡團隊并沒有采用通過增加更多波長和光纖這一常規(guī)方式來提高容量,在ACM網(wǎng)絡熱點研討會上,他們解釋了如何利用更高效布線的光纖攜帶更多數(shù)據(jù)包。
由于密集波分復用技術(DWDM)采用可重新配置的多路復用器,可以非常高效地切換端口之間的波長,因此彈性光網(wǎng)絡可以在通常的固定配置下利用頻譜。通過使用軟件定義廣域網(wǎng)(Microsoft SWAN)將帶寬與可變帶寬收發(fā)器和流量工程相結合,Azure工程師可以混合匹配不同形式的轉(zhuǎn)發(fā)器線卡和高密度互連。
早在2015年,微軟就開始考慮每隔15分鐘為其整個北美光纖骨干網(wǎng)收集所有100Gbps線路的信號質(zhì)量,并將其與微軟研究院的4000公里測試網(wǎng)絡進行比較,以確定其光纖能夠提供的容量。光纖網(wǎng)絡通常對固定容量堅持固定調(diào)制,100Gbps線路始終是100Gbps線路。但光纖實際上可以處理更多的數(shù)據(jù)嗎?
回顧前三個月的數(shù)據(jù),該團隊發(fā)現(xiàn),通過使用帶寬可變的發(fā)射器配置每個通道的調(diào)制方式,他們可以在相同的光纜上獲得70%的網(wǎng)絡容量。這種增長是100,150甚至200Gbps速度的混合,大多數(shù)流量運行在150Gbps。使用25Gb而不是50Gb增量,使速度增加更為細化,能夠更高效的使用光纖,再提供86%的容量,其中大部分流量達到175或200Gbps。
幾個月的數(shù)據(jù)可能存在誤差,所以微軟收集了兩年半的數(shù)據(jù)?;谶@些數(shù)據(jù),微軟北美的骨干網(wǎng)10Gbps網(wǎng)段中的99%可以以150Gbps的速度運行,無需切換光纖甚至中間放大器,只需改變調(diào)制格式即可。實際上,80%的鏈路可以以175Gbps的速度運行,34%的鏈路可以以200Gbps的速度運行。
為了獲得整個網(wǎng)絡中每秒多達145 TB的數(shù)據(jù)量,Azure開始購買帶寬可變的收發(fā)器,這些收發(fā)器可根據(jù)光纖路徑的信噪比在100,150和200Gbps之間進行切換,非常方便Wi-Fi或DSL連接,連接速度取決于網(wǎng)絡的質(zhì)量。
收集網(wǎng)絡數(shù)據(jù)表明,特定網(wǎng)絡鏈路的信號質(zhì)量通常保持不變,除了由于光纖或光學硬件問題導致的下降。這些下降大多數(shù)是因為光纖過度配置導致的,它只需要6.5dB的信噪比來承載100Gbps的流量,但微軟的100Gbps鏈路通常有12dB,這也是為什么它可以承載兩倍的流量。數(shù)據(jù)顯示,故障在175Gbps時增加不多,但在200Gbs時它們確實成為問題,其中一些故障可能持續(xù)數(shù)小時。
令人惱火的是,這些收發(fā)器關閉網(wǎng)絡鏈路以改變連接的調(diào)制平均需要68秒,并且看起來像網(wǎng)絡中的故障。大部分時間都花費在調(diào)試發(fā)送光學數(shù)據(jù)的激光器上,在不關閉激光器的情況下,改變調(diào)制只需35毫秒。因此,如果調(diào)制光纖鏈路的帶寬匹配信號變得很普遍,那么收發(fā)器將需要被設計成幫助網(wǎng)絡運營商最大化容量而不是過度配置固定容量線路以避免鏈路速度變化帶來的高延遲。
還有一個原因推動了改變,在通常情況下,大多數(shù)光纖網(wǎng)絡的故障并不意味著光纖根本無法工作,切斷光纖和電源故障相對較少。
考慮到Azure光纖網(wǎng)絡中7個月的計劃外故障,在90%的情況下,故障鏈路上的信噪比仍超過3dB,足以傳輸50Gbs的數(shù)據(jù),所以能夠根據(jù)需要切換鏈路速度可以提高可用性和容量。
為此,微軟將其網(wǎng)絡測量和數(shù)據(jù)分析研究轉(zhuǎn)變?yōu)獒槍zure網(wǎng)絡光學層的實時性能和故障監(jiān)控引擎。它還在研究如何將鏈路信號質(zhì)量提供給SWAN和Google B4等IP流量工程算法,以便他們可以利用動態(tài)容量鏈接。
思科,Arista,Inohi和ADVA在商業(yè)系統(tǒng)中展示了微軟以前向網(wǎng)絡供應商要求的改變,以提高網(wǎng)絡速度并降低Azure光纖網(wǎng)絡的成本和功耗。 即使對于云提供商來說,動態(tài)光纖連接仍然是一個復雜的選擇,但是更進一步,它們可以證明是一種以比租賃新光纖更低的成本提高您自己的數(shù)據(jù)中心之間的容量和可用性的方法。