ICC訊 2022年9月5日,一年一度的開放數(shù)據(jù)中心(ODCC)峰會在京舉辦。本次峰會以“暢享算力精彩、共赴低碳未來”為主題,邀請眾多行業(yè)知名專家與企業(yè)共同探討了雙碳減排背景下數(shù)據(jù)中心持續(xù)發(fā)展所遇到的挑戰(zhàn)以及多種可行的應(yīng)對方案。而作為ODCC生態(tài)的重要參與者,華為不僅參加了本次峰會的眾多環(huán)節(jié),更用主題分享和精準(zhǔn)的展臺內(nèi)容給出了這一復(fù)雜問題的綜合答案。
華為中國政企媒資系統(tǒng)部總經(jīng)理李騰
領(lǐng)獎“ODCC優(yōu)秀合作伙伴”
在華為看來,要實現(xiàn)低碳前提下的算力發(fā)展,簡單來看是個PUE問題,但真正標(biāo)本兼治的答案則是多樣算力的融合發(fā)展。通過將多樣算力合而為一、綜合運用,數(shù)據(jù)中心便有能力在不同的業(yè)務(wù)負(fù)載類型和專業(yè)化的算力硬件之間實現(xiàn)精確匹配,從而讓不同類型的基礎(chǔ)架構(gòu)盡可能的處理自己所擅長的任務(wù)、始終工作在高效區(qū)間;由此,數(shù)據(jù)中心的服務(wù)產(chǎn)出和能源消耗才能實現(xiàn)一升一降,低碳與算力兩大目標(biāo)才能兼得。
對此,華為計算產(chǎn)品線品牌及產(chǎn)業(yè)營銷總監(jiān)白晨表示,實現(xiàn)低碳發(fā)展、促進(jìn)多樣性算力的融合發(fā)展絕非傳統(tǒng)算力和AI算力的簡單堆砌,而是需要算力、通訊、操作系統(tǒng)、應(yīng)用使能等多重因素的通盤考量;其實踐方法便是“硬件一體、軟件融合”。
達(dá)成這一目標(biāo)并非易事,但好在華為已經(jīng)蹚出了一條頗具可行性的實踐路徑。
華為計算產(chǎn)品線品牌及產(chǎn)業(yè)營銷總監(jiān)白晨
發(fā)表主題演講“算力筑基,以綠色DC共創(chuàng)數(shù)智未來”
DC as a Computer,
讓下一代數(shù)據(jù)中心像電腦一樣高度協(xié)同
“2021年底,我國數(shù)據(jù)中心機架規(guī)模達(dá)到520萬架,近5年復(fù)合增長率超過30%。此外,對非結(jié)構(gòu)化數(shù)據(jù)的處理及AI計算需求仍在快速增長;到2030年,人工智能算力需求將達(dá)到目前的500倍?!?
這是白晨在ODCC主論壇的分享環(huán)節(jié)所給出的一組數(shù)字,既闡釋了數(shù)據(jù)中心重要性,也表明了多樣化算力發(fā)展的巨大前景。但在進(jìn)行算力擴(kuò)張的同時,數(shù)據(jù)中心還應(yīng)該提前做好規(guī)劃,為異構(gòu)算力的高效應(yīng)用鋪平道路。
在這一領(lǐng)域,華為的解題思路是“硬件一體、軟件融合”。
1、硬件一體
針對很多數(shù)據(jù)中心所面臨的能效、部署周期、管理和空間挑戰(zhàn),華為攜手伙伴,推出了全新的液冷集群整機柜產(chǎn)品。通過計算平臺、服務(wù)器節(jié)點、供電、網(wǎng)絡(luò)、布線、散熱等層面的一體化設(shè)計,新的集群整機柜不僅在性能方面能夠做到“一柜頂四柜”,節(jié)約70%機房空間,更能通過冷板式液冷散熱技術(shù)、集中供電、全背板總線等設(shè)計實現(xiàn)能效、部署和運維表現(xiàn)的全維升級。而以機柜為單位進(jìn)行預(yù)制、交付和部署,數(shù)據(jù)中心用戶的產(chǎn)品交付周期也能從過去的3-4月縮短至1周,并在安裝過程中做到0水管連接、0電源線連接、0信號線連接的極簡部署。
2、軟件融合
與硬件系統(tǒng)的通盤考慮一樣,華為也在系統(tǒng)和軟件層面不遺余力;而其發(fā)力點則是歐拉生態(tài)和北冥多樣性計算融合架構(gòu)以及鴻蒙、openGauss等一系列基礎(chǔ)軟件的相互加持。
過去兩年中,華為完成了歐拉操作系統(tǒng)的開源,并將歐拉捐贈給開放原子開源基金會。而由此,歐拉也從創(chuàng)始企業(yè)主導(dǎo)的開源項目演進(jìn)到產(chǎn)業(yè)共建,社區(qū)自治,以更加開放的模式整合全球開發(fā)者貢獻(xiàn),openEuler生態(tài)體系保持快速發(fā)展。在眾多生態(tài)伙伴的貢獻(xiàn)之下,目前openEuler已經(jīng)實現(xiàn)ARM、x86、RISC-V等主流處理器指令集+GPU、NPU、DPU等多種異構(gòu)算力的計算架構(gòu)100%支持覆蓋,適配超100款整機和300余款板卡。
可以說,openEuler已經(jīng)成為最佳支持多樣性算力的數(shù)字基礎(chǔ)設(shè)施開源操作系統(tǒng)。
而在極速成長的AI計算領(lǐng)域,華為則通過北冥多樣性計算融合架構(gòu)的持續(xù)更新,進(jìn)一步拓展了昇騰AI的能力、效率和適用場景。北冥多樣性計算融合架構(gòu)能在基礎(chǔ)架構(gòu)層面支持算力的統(tǒng)一調(diào)度,形成基礎(chǔ)使能層;此外,還提供了統(tǒng)一的開發(fā)工具鏈和管理軟件,讓開發(fā)者、算力使用者和數(shù)據(jù)中心都能在一套框架內(nèi)高效協(xié)作,實現(xiàn)“書同文、車同軌”的效果。
從傳統(tǒng)計算平臺到以用于各類場景的多種加速卡,從服務(wù)器和存儲產(chǎn)品生態(tài)到兼顧算力、密度和能效的液冷集群整機柜,從服務(wù)器所使用的操作系統(tǒng)到輔助多樣算力協(xié)作發(fā)揮效能的計算架構(gòu),華為正在攜手生態(tài)為整個數(shù)據(jù)中心產(chǎn)業(yè)上下游提供相互兼容、運行高效且快速迭代的產(chǎn)品、解決方案體系,讓復(fù)雜、龐大、應(yīng)用多樣的數(shù)據(jù)中心也能像一臺電腦一樣有機高效運行。這正是從更高維度解決應(yīng)用需求、算力發(fā)展和綠色節(jié)能等一系列復(fù)雜問題的靠譜解題思路。
多點發(fā)力,
為算力的高效與安全筑牢根基
算力方面的問題給出答案之后,我們也同樣要重視數(shù)據(jù)中心在網(wǎng)絡(luò)通信、安全可靠等所面臨的眾多實際挑戰(zhàn)。
在從系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)上,數(shù)據(jù)中心當(dāng)?shù)拿總€節(jié)點都有1-4顆處理器以及0-N個GPU、NPU或DPU;而這樣的節(jié)點,數(shù)據(jù)中心里有成千上萬,甚至十余萬個。并且伴隨分布式軟件架構(gòu)的迅速普及,數(shù)據(jù)中心所要面對的業(yè)務(wù)很多時候已不再是節(jié)點內(nèi)或單節(jié)點對單節(jié)點資源協(xié)同,而是多對多的大規(guī)??绻?jié)點協(xié)作。
要解決如此規(guī)模、如此復(fù)雜的問題,我們當(dāng)然需要更先進(jìn)的數(shù)據(jù)中心通訊技術(shù)。
在本次峰會的新技術(shù)與測試組分論壇當(dāng)中,華為DCN標(biāo)準(zhǔn)代表呂云屏女士則為與會嘉賓分享了解決這一問題的最新方法——NDMA(NetworkDMA)技術(shù)。呂云屏女士表示:NDMA技術(shù)以降低多對多集合通信任務(wù)完成時間為優(yōu)化目標(biāo);通過端網(wǎng)協(xié)同構(gòu)建統(tǒng)一的傳輸框架,將多對多通信邏輯下沉到網(wǎng)絡(luò)/傳輸層。相比點到點傳輸,如RDMA、NDMA降低額外系統(tǒng)開銷,最優(yōu)化多對多通信吞吐與時延性能,打破分布式系統(tǒng)性能擴(kuò)展天花板,為大規(guī)模數(shù)據(jù)中心內(nèi)部的多算力協(xié)同和分布式業(yè)務(wù)系統(tǒng)持續(xù)演進(jìn)提供了更強大的支撐。
華為DCN標(biāo)準(zhǔn)代表呂云屏做主題報告
《NDMA,分布式系統(tǒng)高效傳輸新探索》
而在安全層面,華為安全解決方案首席架構(gòu)師王雨晨則在本次峰會的安全分論壇中分享了全新的“韌性”安全理念。王雨晨表示:當(dāng)前,由于安全只以防御威脅為目標(biāo),造成系統(tǒng)一定會被攻破的必然結(jié)果。華為的“韌性”安全架構(gòu),不以盡力而為地對抗威脅為目標(biāo),而是致力于通過“三維度”技術(shù)體系,構(gòu)建可信與韌性的網(wǎng)絡(luò)安全環(huán)境,保證系統(tǒng)行為始終處于可預(yù)期、可驗證的安全狀態(tài)。從而保證關(guān)鍵信息系統(tǒng)在“漏洞開放、威脅存在、防御失效”的極限條件下,確保業(yè)務(wù)安全底線。
華為安全產(chǎn)品線首席架構(gòu)師王雨晨
做主題報告《建立韌性安全,確保安全底線》
同時,在本次峰會上,華為參與制定的《分布式存儲多協(xié)議融合互通技術(shù)規(guī)范》正式發(fā)布。這一規(guī)范的誕生打破了當(dāng)前多種分布式存儲系統(tǒng)在綜合部署時經(jīng)常面對的數(shù)據(jù)格式壁壘,能夠幫助用戶以0拷貝實現(xiàn)數(shù)據(jù)格式的轉(zhuǎn)換,能夠大幅提升多樣性數(shù)據(jù)的分析效率。
此規(guī)范項目經(jīng)理,華為高級標(biāo)準(zhǔn)工程師趙麗麗
榮獲“2022ODCC Manger Award”
展臺展示
在華為展示區(qū),圍繞數(shù)據(jù)中心計算、數(shù)據(jù)中心網(wǎng)絡(luò)及數(shù)字基礎(chǔ)設(shè)施操作系統(tǒng)精煉的展示了最新技術(shù)成果及生態(tài)進(jìn)展。展現(xiàn)了“多樣算力,筑根DC”理念。
華為以“多樣算力,筑根DC”為主題參展
硬件一體、軟件融合、多點發(fā)力;
為數(shù)據(jù)中心持續(xù)高速發(fā)展鋪平道路
從整個市場趨勢來看,2030年前,方興未艾的AI市場還將迎來500倍的算力擴(kuò)張,而已經(jīng)擁有龐大體量的通用算力市場也仍將獲得10倍算力的規(guī)模增長。誠然,在如此速度的增長之下,數(shù)據(jù)中心行業(yè)還要面臨很多挑戰(zhàn)、還要解決眾多具體問題;我們希望通過硬件一體、軟件融合、多點發(fā)力思路,助力ICT產(chǎn)業(yè)快速進(jìn)化,構(gòu)筑安全穩(wěn)固的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,讓數(shù)字經(jīng)濟(jì)基于技術(shù)和算力的持續(xù)進(jìn)步而獲得快速躍遷的能力。