ICC訊 中興通訊產(chǎn)品規(guī)劃首席科學家王衛(wèi)斌在2024 WAIC的AI創(chuàng)新生態(tài)論壇發(fā)表了題為《AI進階,開啟極智算網(wǎng)新未來》的演講,闡述了中興通訊在智算領域的核心理念和戰(zhàn)略布局。
王衛(wèi)斌強調,近一年來,全球大模型和生成式AI技術突破層出不窮,智能計算的發(fā)展進入快車道,AI將從1.0進階到2.0。相較于AI 1.0,從技術上看,AI 2.0階段的大模型將從千億進化到萬億甚至數(shù)十萬億,與此對應,AI基礎設施從千卡集群發(fā)展到了萬卡甚至超萬卡集群,同時也在探索異構集群和長距互聯(lián)集群的可行性。但是,談及AI 2.0更多地是指構建AI產(chǎn)業(yè)開放生態(tài)和商業(yè)成功所面臨的新挑戰(zhàn),包括:從單純的大模型訓練競賽向模型推理應用落地、使能千行百業(yè)的轉變;從性能優(yōu)先、價格昂貴的集群系統(tǒng)向性價比優(yōu)先、人人用得起的普惠算力轉變;從多而不強、自成一體的碎片化封閉生態(tài)向取長補短、多方協(xié)同的開放創(chuàng)新生態(tài)轉變。
面對AI進階新挑戰(zhàn),王衛(wèi)斌表示中興通訊將堅持開放解耦原則,通過“開放基座、以網(wǎng)強算、訓推并舉、多方合作”的核心理念與產(chǎn)業(yè)鏈合作伙伴共同構建一個開放的智算生態(tài)。
首先是構建一個開放的“智算基座”,與主流GPU廠商緊密合作,提供高性能和多樣化的算力解決方案。該方案不僅實現(xiàn)了“換芯不換座”的目標,還可以讓用戶根據(jù)不同場景選擇合適算力,加速AI算力的創(chuàng)新,實現(xiàn)共贏的商業(yè)生態(tài)。
其次是基于“以網(wǎng)強算”理念打造高效超萬卡集群。針對單卡算力受限和機內(nèi)卡間互聯(lián)瓶頸引入了Olink開放交換互聯(lián)的創(chuàng)新突破,這不僅推動了機內(nèi)通信從點對點全網(wǎng)狀互聯(lián)向交換互聯(lián)的轉變,還支持單機更大規(guī)模的GPU部署。針對超大規(guī)模GPU服務器帶寬和擁塞瓶頸,推出超萬卡星云網(wǎng)絡高速互聯(lián)技術,通過大容量交換和400G接口及IGLB全局流控技術實現(xiàn)超萬卡互聯(lián)和端網(wǎng)協(xié)同,極大提升了集群算力的使用效率。
再次是采取“訓推并舉”策略,支持異構GPU混池訓練,避免了對單一算力的依賴。在推理方面,支持多場景、多規(guī)格的推理卡,實現(xiàn)了推理任務的智能分發(fā),為不同的推理任務選擇了性價比最高的推理卡。此外,通過提供遷移工具,支持訓練和推理在不同場景GPU之間的快速遷移,進一步降低了推理成本。
最后是積極推進“多方合作”,催熟AI產(chǎn)業(yè)生態(tài)。中興通訊與業(yè)界主流廠家合作,共同打造ZTE Cloud AI開放實驗室,實現(xiàn)多廠商互操作性測試、系統(tǒng)集成、創(chuàng)新方案驗證和技術標準化;同時與多家業(yè)界主流模型合作,構建多場景系列化AI應用一體機,集成了開放模型倉庫和多場景應用,支持多模型入駐模型和應用靈活適配。這使得最終客戶可以根據(jù)自己的需求,靈活選擇不同模型,打造場景化應用。
王衛(wèi)斌表示,未來AI技術和產(chǎn)業(yè)將持續(xù)進階迭代,中興通訊始終秉持開放共贏的理念,攜手合作伙伴共同構建多元化智算發(fā)展新生態(tài),共贏AI新未來。