ICC訊 近日,在比利時舉辦的ITF World 2024大會上,AMD董事長兼CEO蘇姿豐獲得了IMEC創(chuàng)新大獎,以此表彰其在行業(yè)創(chuàng)新與領(lǐng)導(dǎo)方面的成就,大家熟悉的戈登·摩爾(提出著名的摩爾定律)和比爾·蓋茨都曾經(jīng)獲得該大獎。
圖源:tomshardware
而在獲獎后的演講中,蘇姿豐透露了AMD未來三年的計劃,一個充滿野心的計劃:AMD正在努力實現(xiàn)2025年將計算能效提高到2020年的30倍的計劃,而在這個計劃之后,還有在2027年將能效提高到100倍(相對于2020年)的目標(biāo)。
圖源:AMD
計算能效,簡單來說就是指計算機在執(zhí)行計算任務(wù)時,利用能源的有效程度,雖然在各種算力、核心數(shù)等性能參數(shù)面前,計算能效看起來不太起眼,實質(zhì)上卻是核心性能、功耗管理、制程工藝等技術(shù)的體現(xiàn)。
更高的計算能效,能夠讓計算機系統(tǒng)在運行時有著更高的效率,早在2014年,AMD就曾經(jīng)設(shè)定過一個名為“25x20”的計劃,希望用6年時間將AMD的處理器、顯卡等產(chǎn)品的能效提高25倍。
這個計劃的結(jié)果,就是我們現(xiàn)在所熟知的Zen架構(gòu)和RDNA架構(gòu),憑借兩個架構(gòu)的出色表現(xiàn),AMD在2020年不僅完成了既定的目標(biāo),還超額做到了31.77倍的能效提升。
AMD為何一直將計算能效提升作為核心目標(biāo)之一?首先,我們從目前的AI運算需求出發(fā),看看計算能效提升會帶來什么?
狂奔的超級計算中心
眾所周知,AI已經(jīng)成為當(dāng)前半導(dǎo)體業(yè)界最核心、最龐大的需求,這個需求正在驅(qū)動著半導(dǎo)體戰(zhàn)車的車輪滾滾向前。前段時間,作為AI時代的領(lǐng)航者,半導(dǎo)體公司英偉達(dá)的市值就一度達(dá)到2.62萬億美元,甚至超過了德國所有上市公司的市值總和。
讓英偉達(dá)市值暴漲的唯一原因,就是其在AI計算硬件領(lǐng)域的統(tǒng)治級實力,目前全球最頂尖的專業(yè)計算卡均出自英偉達(dá),除了主流的H100、H200等芯片外,英偉達(dá)前段時間又發(fā)布了GB100和GB200,僅單個芯片的算力就相當(dāng)于以前的一臺超級計算機。
圖源:英偉達(dá)
當(dāng)然,強大的算力背后并不是沒有代價的,H100的TDP高達(dá)700W,而最新的GB200的TDP更是高達(dá)2700W。而英偉達(dá)提供的官方方案中,單個GB200 NVL72服務(wù)器就可以搭載最高36個GB200芯片,僅芯片本身的功耗就最高可達(dá)97200W,并且不包括配套的其他硬件功耗。
這還僅僅是開始,一個超級計算中心往往由多個服務(wù)器單元組合而成,亞馬遜此前就公布了一項計劃,預(yù)計采購2萬個GB200用來組建一個全新的服務(wù)器集群。而走在AI研究最前沿的微軟和OpenAI,前段時間更是公布了一個雄心勃勃的計劃——星際之門。
據(jù)悉,該計劃共分為五個階段,目的是建造一個人類歷史上最大的超級計算中心,預(yù)計整個計劃的投資將達(dá)到1150億美元,建成后將需要數(shù)十億瓦的電力支持。這座‘星際之門’建成后,僅以耗電量算就足以在全球各大城市中排名前20,更何況它還只是眾多計算中心的一員而已。
圖源:AI Revolution
實際上,早在去年開始,就有多份報告指出計算中心的耗電量正在猛增,并且一度導(dǎo)致美國部分城市出現(xiàn)電力供應(yīng)不足的問題。從能源角度來說,一座發(fā)電廠從選址到建成運行,往往需要數(shù)年的時間,如果遇到環(huán)保組織的抗議,還有可能拖延更久。
在能源問題短時間內(nèi)無法解決的情況下,提高計算能效就是唯一的方法,通過更高效地利用每瓦時電力來維持更大規(guī)模的AI模型訓(xùn)練。實際上,有人認(rèn)為OpenAI的ChatGPT-5進(jìn)展緩慢,很大程度上就是受限于算力規(guī)模無法大幅度提升。
蘇姿豐在演講中也提到,提高計算能效可以更好地解決能源與算力之間的矛盾,并且讓超級計算中心可以被部署到更多的地方。在一些AI企業(yè)的構(gòu)想中,未來每一座城市都應(yīng)該擁有自己的超級AI中心,負(fù)責(zé)處理智能駕駛、城市安全等各方面的AI需求。
想要達(dá)成這個目標(biāo),同時不顯著增加城市的能源負(fù)擔(dān),更高計算能效的顯卡就是唯一的解決方案。而且,計算能效也直接關(guān)系到AI計算的成本,只有將AI計算的成本降到更低,大面積普及AI才可能成為現(xiàn)實。
AMD的瘋狂計劃
在英偉達(dá)的刺激下,作為在GPU領(lǐng)域唯一能夠與英偉達(dá)抗衡的企業(yè),AMD一直在加速推進(jìn)旗下AI芯片的研發(fā)與上市進(jìn)度,并先后發(fā)布了MI300、V80等多款專業(yè)運算卡。
據(jù)報道,為了能夠加速AI芯片的進(jìn)度,蘇姿豐對GPU團隊進(jìn)行重組,抽調(diào)大量人員支持AI芯片的研發(fā),以至于下一代的AMD消費級顯卡發(fā)布計劃受到嚴(yán)重影響,比如取消原定的旗艦產(chǎn)品發(fā)布計劃,僅保留中端顯卡的發(fā)布計劃等。
在集中科研力量后,AMD目前的進(jìn)展速度飛快,最新的MI300X在性能上已經(jīng)超過英偉達(dá)的H100,大多42 petaFLOPs,并且擁有高達(dá)192GB的顯存,功耗卻與H100相當(dāng),僅為750W。
圖源:AMD
憑借優(yōu)異的計算能效,MI300X成功引起了市場的關(guān)注,微軟、OpenAI、亞馬遜等科技巨頭都提交了采購需求,讓AMD在計算領(lǐng)域的芯片出貨量暴增。根據(jù)相關(guān)機構(gòu)預(yù)測,2024年AMD的AI芯片出貨量可能達(dá)到英偉達(dá)出貨量的10%,并在明年增長至30%。
據(jù)蘇姿豐介紹,為了能夠提高芯片的計算能效,AMD研發(fā)了多項新的技術(shù),比如2.5D/3D混合封裝技術(shù)。利用這項技術(shù),AMD可以在封裝面積不變的前提下給芯片塞入更多的晶體管和內(nèi)存,降低芯片與內(nèi)存交換數(shù)據(jù)的消耗,有效提升每瓦時的計算性能。
圖源:AMD
此外,AMD還將改進(jìn)芯片架構(gòu),推出能效更高的新一代架構(gòu),預(yù)計最快將于2025年發(fā)布,并實現(xiàn)25x30(2025年計算能效提升30倍)的目標(biāo)。不過,想要實現(xiàn)27x100(2027年計算能效提升100倍)的目標(biāo),還需要在諸多領(lǐng)域做出提升,僅靠制程工藝升級和架構(gòu)升級恐怕還不太夠。
不得不說,AMD的這個計劃非常瘋狂,一旦成功,那么AMD將有望再次與英偉達(dá)并肩而行。
那么英偉達(dá)的反應(yīng)是什么?其實英偉達(dá)很早就給出了回應(yīng),早前發(fā)布的GB200就是答案,這顆史無前例的算力怪物在計算能效方面的提升同樣矚目。據(jù)英偉達(dá)的介紹,GB200的推理性能是H100的30倍,計算能效是H100的25倍(綜合考慮算力、功耗等參數(shù)后的結(jié)果)。
顯然,英偉達(dá)的腳步也并不慢,在接下來的3年時間里,不管AMD能否完成瘋狂的百倍計劃,AI芯片市場都會迎來一場革新。