ICC訊 中興通訊產(chǎn)品規(guī)劃首席科學(xué)家王衛(wèi)斌在2024 WAIC的AI創(chuàng)新生態(tài)論壇發(fā)表了題為《AI進(jìn)階,開啟極智算網(wǎng)新未來》的演講,闡述了中興通訊在智算領(lǐng)域的核心理念和戰(zhàn)略布局。
王衛(wèi)斌強(qiáng)調(diào),近一年來,全球大模型和生成式AI技術(shù)突破層出不窮,智能計(jì)算的發(fā)展進(jìn)入快車道,AI將從1.0進(jìn)階到2.0。相較于AI 1.0,從技術(shù)上看,AI 2.0階段的大模型將從千億進(jìn)化到萬億甚至數(shù)十萬億,與此對(duì)應(yīng),AI基礎(chǔ)設(shè)施從千卡集群發(fā)展到了萬卡甚至超萬卡集群,同時(shí)也在探索異構(gòu)集群和長距互聯(lián)集群的可行性。但是,談及AI 2.0更多地是指構(gòu)建AI產(chǎn)業(yè)開放生態(tài)和商業(yè)成功所面臨的新挑戰(zhàn),包括:從單純的大模型訓(xùn)練競賽向模型推理應(yīng)用落地、使能千行百業(yè)的轉(zhuǎn)變;從性能優(yōu)先、價(jià)格昂貴的集群系統(tǒng)向性價(jià)比優(yōu)先、人人用得起的普惠算力轉(zhuǎn)變;從多而不強(qiáng)、自成一體的碎片化封閉生態(tài)向取長補(bǔ)短、多方協(xié)同的開放創(chuàng)新生態(tài)轉(zhuǎn)變。
面對(duì)AI進(jìn)階新挑戰(zhàn),王衛(wèi)斌表示中興通訊將堅(jiān)持開放解耦原則,通過“開放基座、以網(wǎng)強(qiáng)算、訓(xùn)推并舉、多方合作”的核心理念與產(chǎn)業(yè)鏈合作伙伴共同構(gòu)建一個(gè)開放的智算生態(tài)。
首先是構(gòu)建一個(gè)開放的“智算基座”,與主流GPU廠商緊密合作,提供高性能和多樣化的算力解決方案。該方案不僅實(shí)現(xiàn)了“換芯不換座”的目標(biāo),還可以讓用戶根據(jù)不同場景選擇合適算力,加速AI算力的創(chuàng)新,實(shí)現(xiàn)共贏的商業(yè)生態(tài)。
其次是基于“以網(wǎng)強(qiáng)算”理念打造高效超萬卡集群。針對(duì)單卡算力受限和機(jī)內(nèi)卡間互聯(lián)瓶頸引入了Olink開放交換互聯(lián)的創(chuàng)新突破,這不僅推動(dòng)了機(jī)內(nèi)通信從點(diǎn)對(duì)點(diǎn)全網(wǎng)狀互聯(lián)向交換互聯(lián)的轉(zhuǎn)變,還支持單機(jī)更大規(guī)模的GPU部署。針對(duì)超大規(guī)模GPU服務(wù)器帶寬和擁塞瓶頸,推出超萬卡星云網(wǎng)絡(luò)高速互聯(lián)技術(shù),通過大容量交換和400G接口及IGLB全局流控技術(shù)實(shí)現(xiàn)超萬卡互聯(lián)和端網(wǎng)協(xié)同,極大提升了集群算力的使用效率。
再次是采取“訓(xùn)推并舉”策略,支持異構(gòu)GPU混池訓(xùn)練,避免了對(duì)單一算力的依賴。在推理方面,支持多場景、多規(guī)格的推理卡,實(shí)現(xiàn)了推理任務(wù)的智能分發(fā),為不同的推理任務(wù)選擇了性價(jià)比最高的推理卡。此外,通過提供遷移工具,支持訓(xùn)練和推理在不同場景GPU之間的快速遷移,進(jìn)一步降低了推理成本。
最后是積極推進(jìn)“多方合作”,催熟AI產(chǎn)業(yè)生態(tài)。中興通訊與業(yè)界主流廠家合作,共同打造ZTE Cloud AI開放實(shí)驗(yàn)室,實(shí)現(xiàn)多廠商互操作性測(cè)試、系統(tǒng)集成、創(chuàng)新方案驗(yàn)證和技術(shù)標(biāo)準(zhǔn)化;同時(shí)與多家業(yè)界主流模型合作,構(gòu)建多場景系列化AI應(yīng)用一體機(jī),集成了開放模型倉庫和多場景應(yīng)用,支持多模型入駐模型和應(yīng)用靈活適配。這使得最終客戶可以根據(jù)自己的需求,靈活選擇不同模型,打造場景化應(yīng)用。
王衛(wèi)斌表示,未來AI技術(shù)和產(chǎn)業(yè)將持續(xù)進(jìn)階迭代,中興通訊始終秉持開放共贏的理念,攜手合作伙伴共同構(gòu)建多元化智算發(fā)展新生態(tài),共贏AI新未來。