異構(gòu)計算云計算的下一個戰(zhàn)場

摘要:神女應(yīng)無恙當(dāng)驚世界殊科幻小說《三體》里,世界上最快的計算機(jī),運算速度達(dá)到100萬億次,而如今的機(jī)器計算力可以達(dá)到500萬億次,超算可達(dá)萬億億次級別??茖W(xué)幻想面對當(dāng)前現(xiàn)實的機(jī)器計算力,相形見絀很多了。這

神女應(yīng)無恙 當(dāng)驚世界殊

科幻小說《三體》里,世界上最快的計算機(jī),運算速度達(dá)到100萬億次,而如今的機(jī)器計算力可以達(dá)到500萬億次,超算可達(dá)萬億億次級別。

科學(xué)幻想面對當(dāng)前現(xiàn)實的機(jī)器計算力,相形見絀很多了。

這是什么神力,讓科學(xué)幻想也趕不上世事的滄桑變化?

異構(gòu)計算推進(jìn)算力極大的提高,人工智能再提速

我們可以從最近阿里云新產(chǎn)品發(fā)布會中管窺一斑。

9月12日,阿里云異構(gòu)計算家族首次完美亮相,推出全新一代異構(gòu)加速平臺——涵蓋GPU、FPGA在內(nèi)等6款異構(gòu)實例,可滿足從圖形渲染到高性能計算及人工智能等復(fù)雜應(yīng)用的計算需求。其中新一代FPGA計算實例F2,基于Xilinx硬件可編程芯片打造,可為人工智能產(chǎn)業(yè)提供加速服務(wù),在特定場景下的處理效率比CPU高30倍,而人工智能產(chǎn)業(yè)用戶可通過GN5i搭建微秒級響應(yīng)的AI服務(wù),可將深度學(xué)習(xí)成本縮減50%以上,大幅降低人工智能計算門檻。

與此同時,針對傳統(tǒng)對高性能計算有強(qiáng)烈需求的高??蒲袡C(jī)構(gòu)和企業(yè)用戶,推出的基于阿里云異構(gòu)平臺的全新高性能計算實例E-HPC,可一鍵部署獲得媲美大型超算集群環(huán)境的“云上超算中心”。E-HPC也是中國首個公共云上的HPC as a Service產(chǎn)品。

這是繼企業(yè)級ECS家族全線升級后,阿里云再次在企業(yè)級市場推出專業(yè)服務(wù),新品具備更強(qiáng)的并行能力和多場景支持,不僅全力支撐人工智能計算力升級需求,也為圖形計算、生命科學(xué)、材料力學(xué)、分子動力學(xué)等科研計算領(lǐng)域提供超強(qiáng)普惠計算能力。

數(shù)據(jù)、算力和算法,這是未來科學(xué)技術(shù)也是科技一大潮流人工智能發(fā)展的三大要素。而這一切都要基于云計算。從功能而言,云計算是極其強(qiáng)大的,它可極大地提高信息計算處理能力,徹底降低計算機(jī)軟硬件的投資,并大大地降低信息服務(wù)的復(fù)雜性,根本改變了計算與存儲的方式,使云計算成為未來互聯(lián)運行指揮的“大腦”。比如北京超級云計算中心計算能力為每秒500萬億次未來甚至可達(dá)1000萬億次,而這一切離不開阿里云、騰訊云、華為云、電信云等國內(nèi)知名云計算服務(wù)廠商的貢獻(xiàn)。2017中國云計算企業(yè)百強(qiáng)榜近日出爐,阿里云穩(wěn)居第一,再次宣示阿里云在云計算霸主地位不可動搖。2015年阿里云宣布聯(lián)合中科大研制量子計算機(jī),10-15年后速度將超天河二號百億億倍。這說明高速發(fā)展的云計算計算力正推動著當(dāng)前人類科技的巔峰人工智能及各項科技產(chǎn)業(yè)更大規(guī)模地爆發(fā)。

如今人工智能、深度學(xué)習(xí)已經(jīng)成為產(chǎn)業(yè)界一股強(qiáng)烈浪潮,對各行各業(yè)都將產(chǎn)生深遠(yuǎn)影響。而人工智能、深度學(xué)習(xí)對計算能力的要求相當(dāng)?shù)母撸髶碛斜葌鹘y(tǒng)服務(wù)器強(qiáng)大得多的計算能力和每瓦計算能力,能夠滿足人工智能、深度學(xué)習(xí)對強(qiáng)大計算性能、計算能效以及計算實時性的最大需求,以推動和加速整個人工智能、深度學(xué)習(xí)生態(tài)的迅速發(fā)展。

而此番阿里云推出的異構(gòu)計算加速平臺,主要就是為了進(jìn)一步完善人工智能產(chǎn)業(yè)生態(tài),滿足更多客戶的核心業(yè)務(wù)需求。阿里云此次推出適用于深度學(xué)習(xí)在線推理(Inference)的GPU實例GN5i,采用了英偉達(dá)Pascal架構(gòu)P4圖形處理器,提供最大45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力??筛鶕?jù)深度學(xué)習(xí)計算力的要求,進(jìn)行GPU實例的“Scale-out:水平擴(kuò)容或“Scale-up”垂直變配,分鐘級即可完成實例的創(chuàng)建。2017年初,阿里云就推出基于英特爾Arria 10芯片的FPGA計算實例,有效提升了人工智能及深度學(xué)習(xí)的效率,為企業(yè)節(jié)省成本。而此次發(fā)布的F2實例基于賽靈思Xilinx KU115器件,提供145萬邏輯門電路,單實例的單精度浮點計算性能可達(dá)1.5TFlops,“馬力”超強(qiáng)。

隨著集成英特爾(F1)和賽靈思(F2)芯片的FPGA計算實例相繼問世,加上阿里云業(yè)已推出的FPGA鏡像市場,阿里云率先完成對主流FPGA方案的全覆蓋,成為全球FPGA領(lǐng)域產(chǎn)品線最全、場景最多的公共云服務(wù)商。

應(yīng)運而生,異構(gòu)計算挑起計算大梁的關(guān)鍵技術(shù)

近10年來,計算行業(yè)經(jīng)歷了從32bit、x86-64、多核心、通用GPGPU以及2010年“CPU—GPU”異構(gòu)計算的變遷。而這幾年,隨著人工智能、高性能數(shù)據(jù)分析和金融分析等計算密集型領(lǐng)域的興起,異構(gòu)計算日益火爆起來。

然而在光鮮華麗的表象之下,對于一般用戶來說,異構(gòu)計算的采購、部署以及使用門檻對絕大多數(shù)企業(yè)來說都很高。

痛點如下:1、采購成本居高不少:普通用戶小量采購基本上沒有議價能力,特別是購買試用的FPGA、開發(fā)板還有服務(wù)器,量少的話采購價格非常高。而阿里云從芯片原廠、OEM統(tǒng)一采購芯片和機(jī)器,不需要經(jīng)過層層代理,大大降低采購成本,而且在云上提供按需使用的FPGA對于普通FPGA開發(fā)者來說,讓使用成本得到極大降低。

2、開發(fā)難度大:就是現(xiàn)有的FPGA開發(fā)工具不太友好,而且像Verilog和VHDL這樣的開發(fā)語言,學(xué)習(xí)的門檻比較高。所以對開發(fā)者來說,要想開發(fā)出性能比較高的軟件,需要對FPGA了解非常深入才行,因此開發(fā)難度比較大。

3、交付周期長:通常用戶從開始需要采購,到機(jī)型選擇、硬件架構(gòu)設(shè)計、供應(yīng)商選擇、機(jī)房選擇、財務(wù)審批等流程通常需要幾個月的時間,費時費力;

4、采購不靈活難于把控:采購?fù)炅薌PU/FPGA的數(shù)量就固定了,任務(wù)少的話多買的GPU/FPGA就浪費了,任務(wù)多的話GPU/FPGA數(shù)量又不夠用。

因此,傳統(tǒng)通用計算的方式已經(jīng)難于滿足人們對計算能力的高要求,異構(gòu)計算被認(rèn)為是現(xiàn)階段能挑起計算大梁的關(guān)鍵技術(shù),阿里云異構(gòu)計算產(chǎn)品解決方案就在這樣的大環(huán)境下應(yīng)運而生了。

目前“CPU+GPU”以及“CPU+FPGA”都是最受業(yè)界關(guān)注的異構(gòu)計算平臺,

優(yōu)點明顯:1、GPU/FPGA資源即買即用,靈活自如。有了E-HPC,企業(yè)就能快速獲得高性能計算集群能力,高性能計算調(diào)度能力和軟件能力,按需組建自己的“云上超算中心”,再也不用一次性巨額資金投入,對高性能計算有需求的企業(yè)可以隨買隨用,從而幫助降低購買門檻、計算成本,提高計算靈活性。目前,阿里云E-HPC已向國內(nèi)用戶開放邀測,支持包月包年和按需付費。據(jù)悉,該產(chǎn)品不久將實現(xiàn)全球同步售賣。

2、超大規(guī)模資源池,滿足業(yè)務(wù)峰值的GPU/FPGA大規(guī)模的數(shù)量需求。

3、享受異構(gòu)計算超摩爾定律的硬件紅利,以相同的價格使用性能更強(qiáng)的GPU/FPGA實例;

4、全面的異構(gòu)產(chǎn)品線,滿足人工智能訓(xùn)練、推理,圖像視頻處理等各種不同的需求。對于AI來說,阿里這套解決方案能非常好地加速AI領(lǐng)域的訓(xùn)練和預(yù)測/分類等問題,包括圖像識別、語音識別、視頻識別、視頻監(jiān)控、文字識別、人臉識別、車輛識別、自動駕駛、機(jī)器翻譯等AI的應(yīng)用場景。

5、產(chǎn)品整合:和整個阿里云產(chǎn)品體系深度整合,數(shù)據(jù)打通。

目前,中國的天河2號、天河1號、曙光6000都是異構(gòu)超算,而天河2A和下一代曙光7000超算和神威超算也是異構(gòu)超算,同構(gòu)的超算只有神威藍(lán)光。異構(gòu)超算已成為云計算的共同選擇了。

未來在云服務(wù)器行業(yè),誰在計算、存儲、網(wǎng)絡(luò)三者上做到最好,更高的穩(wěn)定性、更高的彈性和易用性、更高的安全性、更低的成本,誰就拔得頭籌。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-09-19
異構(gòu)計算云計算的下一個戰(zhàn)場
摘要:神女應(yīng)無恙當(dāng)驚世界殊科幻小說《三體》里,世界上最快的計算機(jī),運算速度達(dá)到100萬億次,而如今的機(jī)器計算力可以達(dá)到500萬億次,超算可達(dá)萬億億次級別。

長按掃碼 閱讀全文