六千個NVIDIA A100 GPU提供了近4 百億億次混合精度性能,推進美國國家能源研究科學計算中心(NERSC)科學研究。
其將幫助科學家拼合宇宙三維地圖,以及探索綠色能源的原子內的相互作用。
今天在美國國家能源研究科學計算中心(NERSC)正式啟用的超級計算機Perlmutter將為7000多名研究人員提供近4 百億億次的AI性能。
這使得Perlmutter成為在AI使用的16位和32位混合精度數(shù)學運算方面全球最快的系統(tǒng)。這一性能,還未包括今年晚些時候,將在勞倫斯伯克利國家實驗室系統(tǒng)中開展的項目第二階段。
Perlmutter是全球最大的A100賦能系統(tǒng),搭載6144塊NVIDIA A100 Tensor Core GPU,可支持20多種應用,致力于推動天體物理學、氣象科學等領域的科學發(fā)展。
宇宙三維地圖
這臺超級計算機將在一個項目中協(xié)助拼裝迄今為止最大的宇宙三維地圖。它將處理來自宇宙攝像機——暗能量光譜儀(DESI)的數(shù)據(jù)。暗能量光譜儀每次曝光可以捕獲多達5000個星系。
研究人員需要利用Perlmutter的GPU速度,及時捕捉每晚幾十次曝光,從而確定次日晚間將DESI對準何處。在以前的系統(tǒng)中,研究人員需要幾周乃至幾個月的時間,才能完成一年數(shù)據(jù)的發(fā)布準備工作,而有了Perlmutter,他們在短短幾天內就能完成任務。
NERS數(shù)據(jù)架構師Rollin Thomas目前正在幫助研究人員為Perlmutter編寫代碼,他表示:“GPU讓我們的數(shù)據(jù)準備工作速度提升了20倍,這太令人感到驚喜了?!?
功夫不負有心人
暗能量光譜儀(DESI)的地圖將揭示暗能量這一宇宙加速膨脹背后的神秘物理學現(xiàn)象。暗能量的主要發(fā)現(xiàn)者是伯克利實驗室的天體物理學家Saul Perlmutter,他也因此而獲得諾貝爾獎。這臺新的超級計算機就是以他的名字命名的。
在Perlmutter因這一發(fā)現(xiàn)而獲得諾貝爾獎后, Thomas與他一起開展了后續(xù)的項目。Thomas提到:“Saul向我們證明了一點,人類只要永保好奇心和樂觀精神,就能夠做到任何事情?!?
融合AI和高性能計算的超級計算機
正是有了Saul Perlmutter的精神,許多項目才有望在NERSC的新超級計算機上運行,例如,材料科學領域的研究旨在發(fā)現(xiàn)原子間的相互作用,從而為開發(fā)更好的電池和生物燃料指明方向。
傳統(tǒng)的超級計算機幾乎無法在幾納秒內使用Quantum Espresso等程序來處理模擬多個原子所需的數(shù)學運算。然而,通過將它們的高精度模擬與機器學習相結合,科學家們可以在更長的時間內研究更多的原子。
NERSC的應用性能專家Brandon Cook表示:“以前我們不可能針對電池接口這樣的大型系統(tǒng)進行完整的原子模擬,但現(xiàn)在科學家們計劃用Perlmutter來進行這一模擬。”目前,Brandon Cook正在幫助研究人員啟動此類項目。
A100中的Tensor Core能夠在這方面發(fā)揮其獨特的作用。它們既能加速用于模擬的雙精度浮點數(shù)學運算,又能加速深度學習所需的混合精度計算。
在去年11月,入圍戈登·貝爾獎決賽的BerkeleyGW項目贏得了NERSC的認可,這一項目使用了NVIDIA V100 GPU。在NERSC領導該項目并負責監(jiān)督應用性能的Jack Deslippe認為,A100的強大性能有望將此類研究提升到一個新的水平。
軟件令Perlmutter如虎添翼
Deslippe提到,Perlmutter的另一個戰(zhàn)略組成部分是軟件。與此同時,他還指出該系統(tǒng)所使用的NVIDIA HPC SDK能夠支持OpenMP和其他常用編程模型。
另外,用于GPU上數(shù)據(jù)科學的開源代碼RAPIDS,將加快NERSC內部日漸壯大的Python程序員團隊的工作速度。目前它已在一個項目中證明了自身價值:相比之前的CPU,它使NERSC Cori超級計算機網(wǎng)絡流量分析速度加快了近600倍。
Thomas表示:“這使我們相信,對于如何通過數(shù)據(jù)加速科學研究,RAPIDS將發(fā)揮重要的作用?!?
應對疫情挑戰(zhàn)
疫情期間,Perlmutter項目仍按計劃進行。但團隊不得不重新思考一些重要問題,例如:能為該系統(tǒng)的百億億次級應用編寫代碼的研究人員正在居家辦公,如何在此期間為其舉辦編程馬拉松。
來自慧與(HPE)的工程師們協(xié)助NERSC組裝了第一階段的系統(tǒng),并且與NERSC工作人員合作,對其設施進行了升級以適應新的系統(tǒng)。Thomas表示,“我們非常感謝他們能夠到現(xiàn)場來搭建系統(tǒng),尤其是在疫情期間受到各種規(guī)定限制的情況下?!?
在這場線上啟動儀式上,NVIDIA首席執(zhí)行官黃仁勛對于伯克利實驗室工作人員使用這臺超級計算機推動科學進步的計劃表示了祝賀。
黃仁勛表示:“Perlmutter融合了AI和高性能計算,將為材料科學、量子物理學、氣候預測、生物研究等多個領域的科研帶來突破。”
AI超級計算恰逢其時
今天的線上剪彩儀式具有真正的里程碑意義。
NERSC數(shù)據(jù)和分析服務組代理負責人Wahid Bhimji表示:“美國能源部正在大力發(fā)展人工智能科學,將概念驗證引入粒子物理學、材料科學和生物能源等領域的生產(chǎn)用例。”
“當前人們正在探索更大規(guī)模的神經(jīng)網(wǎng)絡模型,希望獲得更加強大的資源,而Perlmutter基于A100 GPU、全閃存系統(tǒng)和數(shù)據(jù)流功能,能夠適時滿足人們對AI的這一需求?!?
關于 NVIDIA
NVIDIA (NASDAQ: NVDA) 1999年發(fā)明的GPU驅動了PC游戲市場的增長,并重新定義了現(xiàn)代計算機圖形、高性能計算和人工智能。NVIDIA在加速計算和AI領域的創(chuàng)舉正在重塑交通、醫(yī)療健康和制造業(yè)等價值數(shù)萬億美元的產(chǎn)業(yè),并推動了許多其他產(chǎn)業(yè)的增長。更多信息,請訪問 https://nvidianews.nvidia.com/。