原標題:世界最新top500超計算排行榜出爐了! 暴露英偉達雄霸三分之二版圖的擴張之路! 資料來源:墨記
6月22日,在國際超計算大會( isc )期間,發表了最新的top500超級計算機排名。 這個排名顯示了世界現代科學計算的整體情況,引人注目的是前10位的超級計算機中有8臺使用nvidia技術的top500排行榜的全部系統中,有三分之二的系統( 333套)是nvidia
除了當前產品和技術水平的廣泛復蓋外,nvidia還在推動數據觀察、模擬、可視化、邊緣流、ai和云技術的應用,以應對當前和將來的挑戰。 英偉達超越江湖地位再次更新
top500排行榜每年更新兩次。 根據這個最新排名,世界排名前十位的超級計算機中有八臺使用nvidiagpu、infiniband互聯網技術或兩種技術。 這包括美國、歐洲和中國最強大的超級計算機系統。
在top500排行榜的所有系統中,三分之二的系統( 333套)使用nvidia (包括收購的mellanox )增強力量。 在2005年6月公布的排行榜中,使用兩個企業的系統比例合計不足一半( 203套)。
目前,約四分之三( 3(74% )的新infiniband系統使用nvidiamellanoxhdr 200 ginfiniband,標志著這種智能高速數據互聯技術的迅速普及。 自2019年11月以來,采用hdr infiniband的top500系統的數量幾乎增加了一倍。 141臺超級計算機采用infiniband,自2019年6月以來增加了12%。
在top500超級計算機中,305臺系統采用nvidia mellanox infiniband和以太網( 61% ),所有141臺infiniband系統和164臺( 63% )以太網
更多的top500系統使用nvidia gpu、mellanox互聯網技術
或者用了這兩種技術。
top500排名前25的超級計算機中有20臺系統選擇使用nvidia gpu。 為什么? 能源效率是第一個原因。 如下圖所示,采用nvidia gpu的系統與不使用nvidia gpu的系統相比,能效( gigaflops/watt單位)平均高2.8倍。
四周構建頂級超級計算機,每秒100億次ai計算能力!
top500和green500排行榜的主要參考依據之一是linpack benchmark的性能標準。 在計算系統中,每瓦性能( gfloat/watts )是測量特定計算機體系結構或計算機硬件能效的度量。 實際上,它測量了計算機每單位功耗可以消耗的計算速度。 另外,green500比top500更重視計算速度,還重視超計算的能源消耗問題。
nvidia內部研究集群的新成員selene能夠充分說明nvidia gpu的能效表現。 在linpack基準測試中,selene以27.5petaflops的性能,在最新的green500排行榜上排名第二,在top500排行榜上排名第七。
selene的耗電量為20.5 gigaflops/watt,與green500排行榜的第一名的差距很小,但第一名的系統體積很小,其性能表現僅為第394名。
也就是說,selene是前100名系統中唯一突破20 gigaflops/watt能效的系統,是世界上性能第二的產業用超級計算機,是意大利能源巨頭eni s.p.a .的no. 6系統
在能效方面,selene的能效是其他不使用nvidia gpu的top500系統的平均能效性能的6.8倍。
nvidia加速計算產品管理總監paresh kharya表示,除了能效性能外,selene的另一個精彩之處是在不到4周內構建的系統,每套14個 selene是280臺dgx a100系統、2240臺nvidia a100 gpu、494臺nvidiamellanoxquantum 200 Ginfiniband交換機、56 tb/s互聯網體系結構、7pb高性能
selene最重要的性能規格之一是可以提供超過1 exaflops的ai性能。 此外,tpcx-bb的重要數據觀察基準僅采用16臺dgx a100系統即可記錄新記錄,性能是其他系統的20倍。
現在ai和分解是科學計算中的新訴求。 因為這些結果也特別重要。 在世界各地,研究者利用深入的學習和數據觀察來預測各種最有潛力的行業,并進行實驗。 這種方法有助于研究者減少昂貴、耗時的實驗量,加快取得科學成果的速度。
按a100HPC和ai融合的快進按鈕
通過將gpu設為“大”,a100就像大型反應堆。 從年的p100到年的a100,性能提高了9倍以上。 黃仁勛上個月從自家烤箱里拿出的“世界上最大的顯卡”dgx a100是杰作之一,最新發表的selene進一步論證了其“恐怖”。
根據今年gtc上黃仁勛的發布,a100tensor core的一大創新點是引入fp32動態范圍和fp16精度相結合的tensorfloat-32(tf32 )來加速fp32的運算。 據說在hpc的線性動力學場景中性能提高了4倍,在單精度訓練中性能提高了5倍。 總之,第三代tensor core的核心可以為以前傳遞的64位數學模擬和精度較低的ai業務提供加速。
hpc和ai的融合,nvidia按下快進按鈕,ai、數據科學和科學計算融合的新時代似乎開始風靡一時。
目前,世界一流的供應商有華碩、atos、思科、dell technologies、富士通、技嘉技術、hpe、浪潮、聯想、one stop systems、quanta/qct、SuperCiment
這些服務的發售時期各不相同,今年夏天將發售30種系統,預計年底前將發售20種以上的系統。
據悉,此次top500排行榜中現在沒有出現的6臺建設中系統也使用了a100 gpu。 結合硬件和軟件制作大數據,觀察新的基準
現在大企業采用ai獲得生產力和先進的洞察。
tpcx-bb是企業用于實際etl (提取、轉換、加載)和機器學習業務流程的大數據標準測試。 該基準的30個查詢項目包括各種大型數據觀察用例,包括庫存管理、價格分解、銷售分解、推薦系統、客戶細分和情感分解。
迄今為止,該基準僅在cpu系統上運行。 分布式計算系統正在穩步改善,但執行這樣大的數據業務負載存在瓶頸。 nvidia通過rapids軟件生態系統和dgx a100系統,以19.5倍的tpcx-bb性能打破記錄,確立了大數據觀察的新標桿。
該基準測試使用rapids開源數據科學軟件庫工具包,采用由16臺nvidia dgx a100系統組成的群集,nvidia在14.5分鐘內完成了基準測試,迄今為止,cpu系統 該dgx a100集群系統總共構成128個nvidia a100 gpu,配備了nvidia mellanox互聯網功能。 這個硬件和軟件相結合的系統可以加快計算、通信、互聯網和存儲基礎架構。
30個tpcx bb基準的查詢結果
rapids在16個dgx a100系統上運行,為每個10tb測試查詢提供上述相對性能提高。 與以前上傳和采用cpu的方案相比,rapids和dgx a100系統的價格是1/7,功耗是1/3。
此外,nvidia與開源社區合作,為apache spark 3.0帶來了端到端gpu加速,支持重要而耗時的機器學習解決方案前端。
ai模型培訓可以在同一spark群集上解決業務負載,而不是作為單獨的進程在單獨的基礎架構上運行。 這樣,可以高性能地觀察整個數據科學解決過程,從數據湖迅速制作與模型訓練相關的數十甚至數千tb的數據。 此外,無需更改應用于本地和云spark應用程序的現有代碼。
收購mellanox得到的增益大幅度浮現
nvidia在超算這一尖端行業攻城掠奪地的大規模擴張也與mellanox的貢獻密切相關,重新驗證了這一收購的戰術觀點。 產品線與nvidia互補,憑借mellanox的infiniband、以太網等技術,nvidia具有更強的互聯網服務和云功能,形成了更強大的整體處理能力。
根據這次top500的排名,infiniband是排名前十的超級計算機中的7臺高速化,包括中國、歐洲和美國性能最高的系統。
我知道infiniband的設計是基于四個基本的基礎。 是可以運行所有互聯網引擎的智能端點設計。 擴展設計的軟件定義交換互聯網一站式控制和操作的集中管理開放源代碼技術和開放api是確保和支持正向和反向兼容性的標準技術。
這些基本上有助于infiniband實現高互聯網性能、低延遲、高速新聞收發。 作為目前市場上唯一的200gb/s高速互聯產品,infiniband通過端到端自適應路由、擁塞控制和服務質量提供了高互聯網效率。
除了高效的互聯網外,我們也不能忽視數據中心停機造成的價格損失。 根據itic的研究,一小時停止造成的價格損失一般在30萬美元以上。 nvidia推出了最新的ufm cyber-ai平臺,以最大限度地減少數據中心停機造成的損失。 ufm平臺產品系列對infiniband系統進行了近十年的管理,此次擴展使用ai從實時和歷史的遙測和業務負荷數據中學習數據中心的運營節奏和互聯網的業務負荷模型 因此,根據此標準跟蹤系統運行狀況和互聯網篡改,檢測性能下降、招聘狀況和配置文件更改。
nvidia mellanox互聯網事業部高級營銷副總裁gilad shainer表示,該平臺明確了數據中心的獨特生命體征,降低了性能、組件故障和異常招聘方式
infiniband成為氣候研究和天氣預報應用的實際標準。 世界多個氣象服務機構選擇nvidia mellanox infiniband互聯網,以加速西班牙氣象局、中國氣象局、芬蘭氣象局、nasa、荷蘭皇家氣象局等超級計算平臺
北京市氣象臺選擇了200千兆位HDR InfiniBand互聯技術,加快了超級計算平臺。 這個平臺用于增強天氣預報,改善氣候和環境研究,2022年北京冬季奧運會的天氣預報。
氣象模型和氣候模型是計算和數據密集型模型,因此預測質量一般取決于模型的多少、復雜性和高分辨率,分辨率取決于超級計算機的性能,超級計算機的性能是互聯技術在計算資源之間迅速有效地同時擴展
天氣預報已成為超計算改變的新行業。 nvidia a100 gpu和mellanox hdr infiniband互聯網技術帶來的超計算風暴不止這些。 正在重新定義加速計算
因為疫情,今年的超算大會對covid-19相關技術和方案也越來越重視。
nvidia科學計算平臺所起的作用也給加速計算的未來帶來了越來越多的可能性。 從數據觀察到模擬和可視化、ai和邊緣解決,平臺加快了所有行業的方法。
ai .數據觀察和邊緣流重新定義了科學計算。 隨著深入學習和解體的擴展,科學家們運用云計算服務,也運用來自互聯網邊緣的遠程設備的流數據,這些要素共同構成了nvidia加速的科學計算支柱。
加上前面文章多的一點進展,一些前沿的例子值得關注和思考。
在仿真中,在對抗新型冠狀病毒的過程中,橡樹國家實驗室( oak ridge national laboratory )的研究者使用summit超級計算機的內置gpu執行autodock,全年無休,20億種
在科學的邊緣流中,歐洲核研究所( cern )最近宣布,nvidia gpu將把大型強子對撞機內粒子對撞機事件產生的數據量減少500倍。
在可視化中,nvidia的index和magnum io軟件有助于增強火星注冊者號碼的可視化功能,這是世界上最大規模的交互式實時立體可視化項目。
nvidia方面說,最新的top500排行榜以另一種形式證明了nvidia為實現ai和hpc民主化所做的努力。 研究者和公司都強烈要求加快從云到互聯網邊緣的ai和分解。
為科學計算提供端到端業務流程,采用完全創新戰略,加快所有重要的應用行業,是nvidia加快計算行業兩大成功的秘訣。
本文由電子發燒友網原創,未經許可禁止轉載。 需要轉載時,請追加微信號elecfans999
全天候滾動播放最新的財經信息和視頻,越來越多的粉絲福利掃描二維碼備受關注( finance )。
標題:【熱門】全球最新TOP500超算榜單出爐!揭秘英偉達雄霸三分之二版圖的擴張之路
地址:http://www.swled.com.cn/gphq/2671.html