HPC正在改變,中科曙光突破的不止是技術(shù)創(chuàng)新

原標(biāo)題:HPC正在改變,中科曙光突破的不止是技術(shù)創(chuàng)新

今年夏季的ISC 2019在德國法蘭克福召開,展現(xiàn)了最新的業(yè)內(nèi)情況。

除了看TOP 500的排名之外,業(yè)內(nèi)更關(guān)心性能指標(biāo)、產(chǎn)品架構(gòu)和最新的應(yīng)用情況。這不,2009年至2018年累計獲得9屆中國HPC TOP100的榜首中科曙光新一代硅立方高性能計算機亮相ISC 2019之后,引來無數(shù)同行參觀,從安裝開始就有專家10多次去觀看。這款HPC有何魅力?

其實,除了這款產(chǎn)品的性能、架構(gòu)、配置等代表了中科曙光HPC最新技術(shù)的研究之外,還代表了該公司對HPC產(chǎn)業(yè)的思考:行穩(wěn)致遠,才能為產(chǎn)業(yè)、生態(tài)和用戶帶來更多價值。

本文,我們通過中科曙光對HPC的思考,一起看當(dāng)前HPC產(chǎn)業(yè)正在發(fā)生的變化。

TOP 500 誰最強?

先從今年的TOP 500排名說起。

按照國家份額來劃分:部署在中國的HPC,占44%,一共有220套;美國占23%,一共有115套;日本占6%,一共有30套;法國占4%,一共有20套。

按照公司排名來算,在中國的占比中,中科曙光一共為63套,占比13%。而在美國,數(shù)量較多的是HPE 40套,占比8%;Cray 42 套,占比9%,Bull 21 套,占比4%。其他占比較多的有富士通、戴爾、IBM等廠商。

按照技術(shù)的維度看,在TOP 50中,采用NVIDIA系列的產(chǎn)品有12套、Xeon Phi系列的有8套,Power BQC的有3套,ShenWei的有一套。

今年榜首為美國的Summit,F(xiàn)lops 為148.6P;去年為143.5P,略有提升;第二名為Sierra,F(xiàn)lops保持不變,為94.6P。中國的太湖之光和天河二號繼續(xù)為第三、第四名。

從排名看今年變化

在TOP 500的官方網(wǎng)站上,有各種維度的數(shù)據(jù),有興趣的可以仔細看一下,需要說明的是,官方數(shù)據(jù)也在不斷更新中,細節(jié)上可能有所出入。

從今年這個排名上也可以看出來一些新的變化。

1.數(shù)量看,中國市場份額占有絕對優(yōu)勢,其次是美國、日本和法國、英國、德國。但是從性能優(yōu)勢來看,中國尚有進步空間。

2.廠商角度看,中國廠商也占據(jù)絕對優(yōu)勢,排名占據(jù)前三,占比也比去年有提升。

3.從核心技術(shù)來看,英特爾和NVIDIA在芯片上又邁進一步,英特爾的芯片仍舊占絕對主導(dǎo)地位,占比數(shù)值為95.6%。

4.以太網(wǎng)的技術(shù)仍舊為主導(dǎo),其次是InfiniBand。當(dāng)然在速度最快的系統(tǒng)中,40%的系統(tǒng)采用自定義連接。

5.能源效果并沒有太大變化,測試基準(zhǔn)也沒有太大變化。

不過,官方也在TOP 500發(fā)布時說明,從數(shù)量來說,中國占據(jù)絕對優(yōu)勢;但是從質(zhì)量來說,也就是總體的PFlops來說,中國并非榜首。大白話翻譯一下:部分高性能機器是用數(shù)量堆起來的,性能并不突出,偏離“高性能計算”原本的含義,這也是值得警惕的事情。

同時,官方在公布Top 500榜單時,還提出兩個問題。1.隨著摩爾定律,HPC的未來是何處?這其實引申的問題是,每年HPC除了拼性能之外,還有什么可突破的地方?不能總是用性能來引領(lǐng)產(chǎn)業(yè)的趨勢。2.有沒有一個新的測試基準(zhǔn)?這是因為,從去年開始,F(xiàn)aceBook這類廠商搭建的系統(tǒng)(自建)進入榜單。如果保持原有的測試基準(zhǔn)不變,那么對架構(gòu)的要求是否有所改變,這意味新的游戲規(guī)則開始了。

總之這些都是新形勢下的挑戰(zhàn)和變化,對于一個產(chǎn)業(yè)、一個公司和一個產(chǎn)品的走向而言,都具有思考意義,否則,TOP 500就會成為為了榜單而沖榜,失去了原有交流、學(xué)術(shù)和技術(shù)前沿的含義。

全新一代產(chǎn)品發(fā)布

每年發(fā)布TOP 500之后,業(yè)內(nèi)也有這樣或者那樣的討論,總體看,都是如何進一步推動產(chǎn)業(yè)的發(fā)展,而不是僅僅落在排名方面。

這也是中科曙光HPC一直在思考的事情。

從中科曙光的HPC發(fā)展路徑來看,3次進入全球TOP 500前10,創(chuàng)造了眾多第一;產(chǎn)品從曙光一號到當(dāng)前的曙光6000、最新發(fā)布的新一代硅立方高性能計算機等,一直在這條道路上不斷迭代,到目前為止已經(jīng)交付了1萬多套HPC,是亞洲名副其實的最大HPC供應(yīng)商。

之所以有這樣的成就,這和中科曙光一直保持技術(shù)創(chuàng)新分不開。本次發(fā)布的產(chǎn)品也是技術(shù)創(chuàng)新的代表:采用異構(gòu)架構(gòu),可以對CPU、GPU、AI等芯片采用“自由組合”的方式,提高了系統(tǒng)的能效比;采用高速網(wǎng)絡(luò)技術(shù),提升了IO性能和可擴展性;采用EB級高性能存儲,率先進入EB市場;采用全浸沒式相變液冷技術(shù),突破了密集型計算的冷卻瓶頸,PUE降低至1.04;采用智能的先進計算平臺,兼容不同應(yīng)用框架的彈性資源調(diào)度,從運維到運營的體系化覆蓋。

可以說,這個產(chǎn)品從架構(gòu)、網(wǎng)絡(luò)、存儲、基礎(chǔ)架構(gòu)、平臺等方方面面做出了巨大升級,這也是此次中科曙光展示的重點,要向全行業(yè)展現(xiàn)技術(shù)領(lǐng)先性,保持中國力量,借此機會展開更多、更好的合作,共同做大生態(tài)圈。

在展臺這兩天,除了聽會之外,密集的與產(chǎn)業(yè)各方面交流,也傾聽了中科曙光高性能計算產(chǎn)品事業(yè)部首席科學(xué)家吉青博士等人對曙光自身發(fā)展的觀點,結(jié)合產(chǎn)業(yè)的趨勢,有如下想法。

首先,TOP 500在求變。經(jīng)過10多年的發(fā)展之后,TOP 500的體系相對成熟。隨著新技術(shù)的不斷發(fā)展和新應(yīng)用的不斷增多,如何讓榜單體系更合理,更接地氣,組委會也在考慮。未來不排除采用多個細分基準(zhǔn)的測試,這樣就能囊括的范圍更廣、參評的企業(yè)更多,而不是僅僅強調(diào)分數(shù)和排名,那樣就會形成現(xiàn)在“數(shù)量和質(zhì)量”之間的矛盾,放在中國尤為如此。

其次,不斷追求極致的技術(shù)。讓“高性能”本身回歸技術(shù)范疇,在科研、生物、化學(xué)、氣象等領(lǐng)域深入應(yīng)用,不斷與最新的技術(shù)結(jié)合,不斷突破現(xiàn)有的技術(shù)邊界。比如此次中科曙光發(fā)布的產(chǎn)品在架構(gòu)、存儲、冷卻技術(shù)上均有大的突破,這意味著中科曙光憑借著20多年的積累,穩(wěn)步的走在了全行業(yè)的前列。

盡管從數(shù)量來說,中科曙光并不是最多的,但能帶動全行業(yè)的趨勢發(fā)展和變革,這是最值得學(xué)習(xí)的地方。當(dāng)然,如果中科曙光沒有“行穩(wěn)致遠”的精神和一腦門“科研精神”,就不可能實現(xiàn)這個目標(biāo),從Supercomputer跨越到Supercomputing(從超級計算機到超級計算技術(shù))。背后始終是技術(shù)驅(qū)動、行業(yè)驅(qū)動和用戶驅(qū)動。

當(dāng)然,有了技術(shù)不是最好的。最好的是傾聽用戶的聲音,在應(yīng)用、提高HPC的效率方面做出變革。

如何讓HPC發(fā)揮最大價值?

讓HPC技術(shù)與應(yīng)用結(jié)合,這也是近年來的一個趨勢。這意味著從用戶的需求開始,HPC廠商就應(yīng)該進入服務(wù)過程中,從咨詢、設(shè)計、產(chǎn)品實現(xiàn)到運維等全流程全部納入到服務(wù)范圍之內(nèi)。盡管這些年中國HPC已經(jīng)在應(yīng)用方面有了較大的改變,但是還不夠。這包括:如何讓硬件發(fā)揮最大優(yōu)勢、如何讓應(yīng)用平臺與軟件調(diào)優(yōu)想適配,如何讓用戶有自主使用資源的權(quán)利等,這些都值得探討。

中科曙光的做法是,除了傾聽用戶的聲音之外,還搭建了EasyOP在線運維管理平臺和先進計算服務(wù)平臺,囊括了硬件調(diào)優(yōu)服務(wù)、知識庫等服務(wù),通過共享和開放的形式,逐步探索新的服務(wù)模式,滿足不同類型的用戶需求。也就是說,用戶不管是購買硬件(不管是否包括運維服務(wù))還是購買服務(wù)(租用硬件),中科曙光的超算服務(wù)平臺都可以滿足。

除此之外,中科曙光還以“資源池”的方式構(gòu)建HPC的基礎(chǔ)設(shè)施,歡迎不同地區(qū)的資源加盟,納入到EasyOP平臺中,逐步做大HPC的生態(tài)圈。當(dāng)前,已經(jīng)在中國安徽、河北以及歐洲建立三個分中心,活躍集群接近200套。這是在商業(yè)模式、資源利用、用戶服務(wù)方面均有所創(chuàng)新。

實際,這種模式再延伸就會成為業(yè)內(nèi)技術(shù)——產(chǎn)品——解決方案——平臺——生態(tài)的發(fā)展路線,成為國內(nèi)首屈一指的HPC生態(tài)圈,那樣,用戶可以將自己的應(yīng)用封裝,供其他類似場景的用戶調(diào)用,消滅“發(fā)明輪子”的過程,極大刺激和繁榮同行之間的交流,促進HPC的高效利用。

正如中科曙光高級副總裁任京暘一再強調(diào)的,中科曙光會加強對核心技術(shù)長期、穩(wěn)定的研發(fā)投入,聯(lián)合上下游合作伙伴共建全球范圍內(nèi)完善的先進計算生態(tài),助力中國超算事業(yè)服務(wù)于世界。

這可能就是中科曙光帶給業(yè)內(nèi)的,不僅僅是技術(shù)創(chuàng)新,而是用更多的方法論和實踐促進產(chǎn)業(yè)更好的交流合作,促進HPC高效使用,讓HPC成為全社會計算的基石,讓更多人享受到技術(shù)的便捷和價值,從而帶動其他產(chǎn)業(yè)的發(fā)展。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-06-18
HPC正在改變,中科曙光突破的不止是技術(shù)創(chuàng)新
從中科曙光的HPC發(fā)展路徑來看,3次進入全球TOP 500前10,創(chuàng)造了眾多第一;產(chǎn)品從曙光一號到當(dāng)前的曙光6000、最新發(fā)布的新一代硅立方高性能計算機等,一直在這條道路上不斷迭代,到目前為止已經(jīng)交付

長按掃碼 閱讀全文