當(dāng)前,AI芯片的功能日益復(fù)雜化、多樣化,一方面,芯片廠(chǎng)商紛紛給出不同的衡量標(biāo)準(zhǔn),聲稱(chēng)其產(chǎn)品在計(jì)算性能、單位能耗算力等方面處于行業(yè)領(lǐng)先水平;另一方面,用戶(hù)卻關(guān)心如何能從廠(chǎng)商給出的信息中判斷出芯片是否能實(shí)際滿(mǎn)足其真實(shí)場(chǎng)景的計(jì)算需求。
因此,成立于2018年5月的行業(yè)基準(zhǔn)測(cè)試組織MLPerf推出了MLPerf基準(zhǔn)測(cè)試,MLPerf基準(zhǔn)測(cè)試是業(yè)內(nèi)首套衡量機(jī)器學(xué)習(xí)軟硬件性能的通用基準(zhǔn),即訓(xùn)練過(guò)的神經(jīng)網(wǎng)絡(luò)在不同量級(jí)的設(shè)備(物聯(lián)網(wǎng)、智能手機(jī)、PC、服務(wù)器)、各種應(yīng)用(自動(dòng)駕駛、NLP、計(jì)算機(jī)視覺(jué))上處理新數(shù)據(jù)的速度。MLPerf現(xiàn)有50多家成員,包括谷歌、微軟、Facebook、阿里巴巴等企業(yè),以及斯坦福、哈佛、多倫多大學(xué)等高校,并跟隨AI的發(fā)展步伐持續(xù)演進(jìn)。
根據(jù)近日發(fā)布的MLPerf基準(zhǔn)測(cè)試結(jié)果顯示,內(nèi)置超過(guò)2000個(gè)NVIDIA A100 GPU的NVIDIA全新DGX SuperPOD在市售商用產(chǎn)品中脫穎而出,在各項(xiàng)針對(duì)大規(guī)模計(jì)算性能的MLPerf基準(zhǔn)測(cè)試中均取得了優(yōu)異成績(jī)。此次已是NVIDIA在MLPerf訓(xùn)練測(cè)試中連續(xù)第三次展現(xiàn)了最強(qiáng)勁的性能。2018年12月,NVIDIA首次在MLPerf訓(xùn)練基準(zhǔn)測(cè)試中創(chuàng)下了六項(xiàng)紀(jì)錄,次年7月NVIDIA再次創(chuàng)下八項(xiàng)紀(jì)錄。
NVIDIA在測(cè)試中用到的產(chǎn)品基于最新NVIDIA Ampere架構(gòu)以及Volta架構(gòu)。A100 Tensor Core GPU在加速器的全部八項(xiàng)MLPerf基準(zhǔn)測(cè)試中展現(xiàn)了最快的性能。在實(shí)現(xiàn)總體最快的大規(guī)模解決方案方面,利用HDR InfiniBand實(shí)現(xiàn)多個(gè)DGX A100系統(tǒng)互聯(lián)的龐大集群——DGX SuperPOD系統(tǒng)在性能上,也開(kāi)創(chuàng)了八項(xiàng)全新里程碑。
NVIDIA是唯一一家在所有測(cè)試中均采用市售商用產(chǎn)品的公司。其他大多數(shù)提交使用的要么是預(yù)覽類(lèi)別(preview category),其所用的產(chǎn)品預(yù)計(jì)需要幾個(gè)月后才會(huì)面市,要么使用的是研究類(lèi)別的產(chǎn)品,更是較長(zhǎng)一段時(shí)間內(nèi)都不會(huì)面市。
速度與規(guī)模兼得的DGX SuperPOD架構(gòu)
NVIDIA在Selene上運(yùn)行了系統(tǒng)的MLPerf測(cè)試,Selene是基于DGX SuperPOD的內(nèi)部集群。DGX SuperPOD是針對(duì)大規(guī)模GPU集群的公共參考架構(gòu),NVIDIA DGX SuperPOD基于NVIDIA DGX A100系統(tǒng)。NVIDIA DGX A100在一臺(tái)6U服務(wù)器中集成了8顆A100 GPU以及NVIDIA Mellanox HDR InfiniBand網(wǎng)絡(luò)技術(shù),可以為高性能計(jì)算、數(shù)據(jù)分析和AI工作(包括訓(xùn)練和推理)等多種組合提供加速,并實(shí)現(xiàn)快速部署。
Selene最近在TOP500榜單中首次亮相,憑借百億億次(exaflops)級(jí)別的AI性能,成為美國(guó)最快的工業(yè)系統(tǒng)。它也是Green500榜單中全球第二大節(jié)能系統(tǒng)。除了出色的能效表現(xiàn),Selene的快速部署能力也是令人刮目相看。工程師們可以使用NVIDIA的模塊化參照架構(gòu),在不到四周的時(shí)間內(nèi)就能快速構(gòu)建Selene。4名操作人員僅需不到1個(gè)小時(shí),就能組裝起一套由20臺(tái)系統(tǒng)組成的DGX A100集群,創(chuàng)建出一套性能可以達(dá)到2petaflops的系統(tǒng)。
目前,客戶(hù)已經(jīng)采用這些參考架構(gòu)來(lái)構(gòu)建自身的DGX POD和DGX SuperPOD。其中包括美國(guó)最快的學(xué)術(shù)領(lǐng)域AI超級(jí)計(jì)算機(jī)HiPerGator,該超級(jí)計(jì)算機(jī)也將成為佛羅里達(dá)大學(xué)跨學(xué)科AI創(chuàng)新的基石。
同時(shí),全球領(lǐng)先的超算中心Argonne國(guó)家實(shí)驗(yàn)室正在使用DGX A100,尋找抗擊COVID-19疫情的方法。Argonne國(guó)家實(shí)驗(yàn)室是六個(gè)首批采用A100 GPU的高性能計(jì)算中心中的先行者之一。
DGX SuperPOD現(xiàn)已助力汽車(chē)領(lǐng)域的大陸集團(tuán)、航空航天領(lǐng)域的Lockheed Martin和云計(jì)算服務(wù)領(lǐng)域的微軟等公司取得了良好的業(yè)務(wù)成果。這些系統(tǒng)的順利運(yùn)轉(zhuǎn),部分得益于其廣泛的生態(tài)系統(tǒng)對(duì)于NVIDIA GPU和DGX支持。
123下一頁(yè)>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )