×
×

英偉達聯手Arm迎戰高性能計算!GPU加速卡將支持Arm架構CPU

2019-06-18 09:25:28 來源:智東西

 
在今日于德國舉行的ISC 2019國際超算大會上,美國芯片巨頭英偉達(NVIDIA)今天宣布其用于超級計算機的加速平臺將對Arm架構CPU支持,即計劃利用其芯片與使用Arm架構的CPU協作打造超級計算機。
 

這為高性能計算(HPC,High Performance Computing)行業開辟了一條全新的路徑,為能夠實現“exascale”性能的超級計算機鋪平道路,有助于構建具有極高能效水平的百萬兆級AI超級計算機。
 

NVIDIA表示,將于年底前向Arm生態系統提供全堆棧的AI和HPC軟件。堆棧優化完成后,NVIDIA將能為包括x86、POWER和Arm在內的所有主流CPU架構提供加速。
 

 

此外,NVIDIA還于今日推出了全球排名第22快的超級計算機DGX SuperPOD,據稱可滿足自動駕駛車輛部署計劃的大量需求。
 

一、NVIDIA將支持Arm CPU
 

NVIDIA一直是數據中心市場的佼佼者,其GPU芯片被用于與英特爾、IBM等公司的中央處理器CPU)協同工作,完成大規模并行計算的加速任務。
 

在超大規模數據中心和高性能計算的服務器市場,英特爾x86處理器長期占據主導地位,隨后IBM Power芯片則成為后起之秀,而IBM的Power處理器在近年亦出現翻盤之勢,主要在中低端服務器芯片市場分食x86的市場蛋糕,而Arm則試圖在中低端服務器市場贏得更多的市場份額。
 

英國Arm公司是全球領先的半導體知識產權(IP)供應商, 于2016年被日本軟銀集團以234億英鎊(約合310億美元)高價收購。
 

不同于英特爾和IBM,Arm公司本身不直接從事芯片生產,而是依靠給芯片廠商們提供底層的處理器架構授權,從而獲得授權費用和一定版稅。
 

蘋果、三星、高通、華為、飛利浦等各大芯片廠商們都從Arm那里購買授權,全球絕大多數智能手機和平板電腦等便攜式消費電子產品均采用Arm架構。
 

和其他架構相比,Arm的一大特色在于出色的能效,它能夠為超級計算機提供開放式架構,因此用戶可以添加各種有益于超級計算的有趣技術,例如緊密集成。
 

NVIDIA副總裁兼加速計算總經理Ian Buck稱,通過將Arm CPU與Tesla GPU相結合,使用者可以完成大量的HPC仿真和AI所需的繁重計算,并且Arm可以使用快速單線程來執行CPU
 

Arm已經在世界各地的許多HPC中心獲得了越來越多的關注,此前采用Arm架構的exascale系統沒有GPU,如今NVIDIA新增對Arm支持的舉動并不令人意外。
 

 

Buck表示,從技術角度來看,用Arm制造超級計算機的項目將是一次“重舉”。據他介紹,現在是NVIDIA宣布支持Arm CPU的最佳時期,他們花了兩年的時間來完成所有這些工作,希望在今年年底之前發布第一個完整版本。
 

NVIDIA支持Arm CPU后,將為研發超算的研究人員們提供了除英特爾和IBM外的第三種選擇,并使得研發者可以通過這種方式獲得更多的自主控制能力。
 

二、年底前向Arm生態系統提供全堆棧的AI和HPC軟件
 

HPC市場預計到2025年價值將達到596.5億美元,NVIDIA一直是推動高性能計算發展的重要力量。今日發布的Green500排行榜,在全球最節能的25款超級計算機中,有22款都得益于NVIDIA的支持。
 

 

之所以能有如此成績,源自NVIDIA的多項核心技術。采用NVIDIA GPU的超級計算機,能夠將繁重的處理作業卸載至更為節能的并行處理CUDA GPU之上,另外NVIDIA與InfiniBand和以太網互連供應商Mellanox合作優化整體超級計算集群的處理,NVIDIA還在SXM 3D封裝技術和可實現極密集型擴展節點的NVIDIA NVLink互聯技術方面投入大量研發。
 

NVIDIA對基于Arm的HPC系統的支持建立在雙方超過10年的合作基礎之上。NVIDIA的幾款用于便攜式游戲、自動駕駛汽車、機器人和嵌入式AI計算的系統級芯片產品都采用了Arm。
 

據悉,NVIDIA將于年底前向Arm生態系統提供全堆棧的AI和HPC軟件,該堆棧為600多個HPC應用程序和所有AI框架提供加速,其中包括所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發工具,如支持OpenACC的PGI編譯器和性能分析器。

\

NVIDIA創始人兼首席執行官黃仁勛表示:“超級計算機是促進科學發現的重要工具,建立百萬兆級超級計算將能夠極大地擴展人類知識的邊界。隨著傳統計算規模擴展步伐的停止,功率也將成為所有超級計算機的限制因素。NVIDIA CUDA加速的計算和Arm的高能效CPU架構的相結合,將助力HPC社區實現大幅提升,以達到百萬兆級。”
 

“Arm正在與生態系統合作,為基于Arm的SoC帶來前所未有的計算性能提升,并實現百萬兆級功能,”Arm首席執行官Simon Segars表示,“HPC社區已經部署了Arm技術,以應對全球最復雜的研究挑戰。通過與NVIDIA合作,將CUDA加速引入Arm架構,這一舉措對于HPC社區來說,可謂是一大重要里程碑。”
 

三、在HPC行業及Arm生態系統,部分業內人士這么看
 

Ampere Computing董事長兼首席執行官Renee James認為,其客戶正致力于尋求基于Arm的高性能處理器,來運行其最苛刻的工作負載,因此很高興NVIDIA正在將CUDA和圍繞NVIDIA所建立的豐富的生態系統引入Arm。
 

Arm生態系統另一位領導者——Atos的高級執行副總裁、大數據和網絡安全部門負責人Pierre Barnabé亦表示,這一重要發布將加速AI和模擬世界的融合,同時優化能效。
 

Cray總裁兼首席執行官Peter Ungaro表示,其Cray系統管理和編程環境(編譯器、庫和工具)已經能夠在XC和未來的Shasta超級計算機上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺,并將其與Cray系統管理和編程環境緊密集成。
 

此外, CSC、 EPI、HPE、Jülich超算中心、Marvell等均表態稱,看好將Arm架構與NVIDIA GPU相結合,認為它將有助于優化HPC和AI工作負載,匹配未來百萬兆級前(pre-exascale)解決方案的構建模塊,助力HPC行業解決日益不可持續的功耗水平問題。
 

 

在高校與科研機構的一些專家也發表了看法,比如理化學研究所計算科學研究中心負責人、東京工業大學教授Satoshi Matsuoka。
 

“過去十年中,我們一直積極率先在大型超級計算機上采用NVIDIA GPU,包括日本最強大的ABCI超級計算機,”Satoshi Matsuoka說,“理化學研究所計算科學研究中心目前正在致力于開發下一代基于Arm的百萬兆級Fugaku超級計算機,我們很高興聽到NVIDIA的GPU加速平臺很快將能夠用于基于Arm的系統。”
 

四、全球第22快的超算DGX SuperPod
 

今日,NVIDIA還推出了全球排名第22快的超級計算機:DGX SuperPOD。據NVIDIA人工智能基礎設施副總裁Clement Farabet表示,它提供的AI基礎設施可滿足公司自動駕駛車輛部署計劃的大量需求。
 

據介紹,SuperPOD包含96個DGX-2H單元和1536個V100 Tensor Core圖形芯片,與Mellanox和NVIDIA的NVSwitch技術相互連接。
 

它比同等頂級超級計算系統小約400倍,組裝只需三周,同時提供9.4 petaflops的計算性能。在實際測試中,它試圖在不到兩分鐘的時間內訓練基準AI模型ResNet-50。
 

 

“很少有AI挑戰與訓練自動駕駛汽車一樣苛刻,這需要對神經網絡進行數萬次重新訓練,以滿足極端的精確度需求,”Farabet說,“沒有像SuperPOD那樣的大規模處理能力的替代品。”
 

客戶可以從NVIDIA的任何DGX-2合作伙伴處購買SuperPOD的全部或部分內容。
 

結語:進一步推動HPC擴展性能和優化能效

如果NVIDIA按照預期,在年底前為Arm生態系統提供全套的人工智能和高性能計算(HPC)軟件,這將為超算研發者們提供除x86、Power之外,另一種更具開放性的選擇。
 

此外,從眾多業內人士的表態來看,這一重要發布對于基于Arm打造超級計算機的研發機構或企業而言,將是進一步擴展其超算性能,推動高性能計算提供更出色能效的重要推動力。


免責聲明:本文由作者原創。文章內容系作者個人觀點,轉載目的在于傳遞更多信息,并不代表EETOP贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時聯系我們,我們將在第一時間刪除!

全部評論

重庆时时彩走势软件