未來10年的存儲創(chuàng)新,就被這個技術(shù)承包了

2019年,隨著在NVMe技術(shù)方面的突破和演進,超大規(guī)模數(shù)據(jù)中心和高性能計算用戶很快將從中受益。在后摩爾定律時期,在CPU性能增長放緩的背景下,NVMe技術(shù)以及NVMe over fabric技術(shù)的發(fā)展,將成為推動IT技術(shù)創(chuàng)新的新動力。當(dāng)然,所有這一切背后都是有實際需求在推動。

?

翻開歷史來看,NVMe的發(fā)展可謂是非常迅速。2014年,第一批NVMe技術(shù)方案還只是服務(wù)器上的一個驅(qū)動而已,這個驅(qū)動負責(zé)處理存儲訪問操作。

如今,許多超大規(guī)模數(shù)據(jù)中心,做高性能計算解決方案的廠商都在節(jié)點上測試NVMe。由于NVMe的方案是針對節(jié)點規(guī)模擴展的,這就帶來很高的靈活性,同時還有非常高的性能提升優(yōu)化空間。

雖然NVMe對于那些需要用到非易失性存儲的應(yīng)用帶來了很大幫助,但是,下一階段NVMe over fabric的帶來的影響將更為深遠。

以太網(wǎng)的帶寬爆炸式增長,100GB/s還有400GB/s之類的似乎也都不遠了。存儲如果能用上這樣的能力,在服務(wù)器看來,就像是在本地一樣了。

市場上Mellanox,Pure Storage,Excelero都有類似的創(chuàng)新,以太網(wǎng)的方案整體來說都比較簡單,這些創(chuàng)新方案的思路就是用簡潔的方式來匯集存儲資源,雖然是遠程訪問,但是看起來就像是訪問本地存儲一樣。

降低存儲網(wǎng)絡(luò)復(fù)雜度帶來的好處非常明顯,它有助于打造更大規(guī)模存儲集群,用更少的資源做更多的事兒。

未來,隨著NVMe over fabrics成本大幅降低,NVMe將在技術(shù)方案和市場上釋放更大的能量。

成本下降,這意味著就可以投入大規(guī)模使用了。超大規(guī)模數(shù)據(jù)中心由于采購量大,可以用和SATA相同的價格用上NVMe,對于一般用戶來說,多花點錢用3GB/s帶寬替代500MB/s的SATA也非常合適。

雖說NVMe的成本會降低,前景一片大好,不過真正想把一個新技術(shù)推向市場,起碼市場上得有好幾個同類方案。大家一起來教育市場,然后才有向傳統(tǒng)存儲體系架構(gòu)發(fā)起挑戰(zhàn)的資格。

?

NVMe化解傳統(tǒng)存儲架構(gòu)的新挑戰(zhàn)

在市場上可以看到,Excelero在研究NVMe over fabric方面的技術(shù),Mellanox,Pure Storage還有NetApp也在研究,具體的做法都不太一樣。不過,面對實際用戶需求,要解決的問題會有許多相似之處。

比如,Excelero有一家歐洲的大型銀行客戶,這家銀行需要跑SAS分析負載,依靠傳統(tǒng)方案做一些日常分析的話大概需要四十個小時,由于速度太慢,日常性的報告不能及時提供,以至于影響了歐盟的有關(guān)規(guī)定。

在這一場景下,單單說不怕浪費,多掛點NVMe盤已經(jīng)解決不了問題了。

這家銀行的方案是,在GPFS上構(gòu)建SAS網(wǎng)絡(luò)集群,同一時間可能有八個節(jié)點在同一個數(shù)據(jù)集上工作,數(shù)據(jù)集是不能分割的,由于這是延遲和帶寬敏感型應(yīng)用,當(dāng)對一天的數(shù)據(jù)進行檢索的時候,對存儲帶寬,隨機IO性能都提出了很高要求。

Excelero的方案提供的共享資源池正好解決了這一問題,降低了小IO讀寫的延遲,讀寫帶寬的主要瓶頸也就是網(wǎng)絡(luò)了。不過,生成分析報告的時間縮短到了6個小時。

Excelero的方案非常有代表性,值得借鑒,足以說明NVMe over fabric的價值點,使得用NVMe over fabric構(gòu)建的遠程存儲提供的共享資源池,能利用上像GPFS這樣的大規(guī)模并行系統(tǒng)。

集群存儲的另一種做法是,在每一個主機上都復(fù)制一份數(shù)據(jù)集。這種做法,首先資源開銷非常巨大,為了讓每份數(shù)據(jù)都保持一致,所以主機互聯(lián)的技術(shù)經(jīng)常需要傳輸大量的指令,效率非常低下,集中共享的存儲非常有必要。

?

類似的,一家名為CMA的公司正在研究用NVMe技術(shù)支持Oracle Exadata的集群方案。

NVIDIA的DGX系統(tǒng)能讓多個GDX-1同時工作,也是一個集群系統(tǒng),也有人在思考如何讓GDX更好地用上NVMe的能力。

比如,金融領(lǐng)域有時候需要將一個工作負載分散到多臺DGX-1上,有的朋友可能會馬上想到DGX-1農(nóng)場,DGX-1農(nóng)場的問題是只能用SATA盤,如果換成NVMe的話,帶寬和延遲將發(fā)生非常大的變化。

雖然DGX-2開始支持NVMe了,但是數(shù)量非常有限,只能使用機箱里提供的那有限的幾塊NVMe SSD。

能不能讓所有的DGX-2都用到NVMe資源池,讓所有的機器都自由訪問共享內(nèi)存呢?這也是個有趣的問題。可能不久后,NVIDIA也會推出類似的方案。

人工智能場景將成為推動

NVMe存儲創(chuàng)新的一大動力

人工智能將是推動NVMe over fabric發(fā)展的又一大因素。人工智能技術(shù)的發(fā)展,對于那些做算法回溯測試,還有做醫(yī)學(xué)成像、地理信息系統(tǒng)(GIS)的行業(yè)帶來了很大幫助。

但是由于訓(xùn)練時候需要處理大量圖像,這對于存儲帶來很大挑戰(zhàn),人工智能的能力受到了限制。

雖然有ResNet這樣的基準(zhǔn)測試會使用許多小的圖片來做測試,讓人看到一些性能表現(xiàn),但在很多時候,真正用的其實有很多大圖像。

比如,MRI還有衛(wèi)星圖像的分辨率非常大,圖像大小可能是好幾兆甚至幾十兆,拿這些數(shù)據(jù)來做訓(xùn)練的話,對存儲系統(tǒng)的延遲和帶寬要求是非常高的。

在銀行的賬戶交易系統(tǒng)中,也需要擴展集群來處理實時的請求,構(gòu)建一個集中的資源池來應(yīng)對隨機訪問需求。如果是一個幾十TB的數(shù)據(jù)集,不可能在每個主機上復(fù)制一份數(shù)據(jù)并且及時同步數(shù)據(jù),唯一合理的做法是搭建一個獨立的存儲資源池。

?

簡單來說,NVMe之所以將獲得飛速發(fā)展,核心原因還是需求推動的,那些特定工作負載,還有業(yè)務(wù)量巨大的公司都必須重新構(gòu)建基礎(chǔ)架構(gòu)。

如今的IT領(lǐng)域,主流的創(chuàng)新主要來自云和超大規(guī)模數(shù)據(jù)中心領(lǐng)域,新技術(shù)很多時候都會在這一領(lǐng)域出現(xiàn)或者發(fā)揚光大,NVMe的發(fā)展也將隨之爆發(fā)。

但因為現(xiàn)有IT架構(gòu)的影響以及新的解決方案的成熟度,想真正在市場上看到NVMe的能力還得再等等。

可以肯定的是,NVMe將帶來許多新的突破,這個突破將對IT領(lǐng)域影響深遠,是否是影響未來十年的技術(shù)也未可知。

【科技云報道原創(chuàng)】

微信公眾賬號:科技云報道

來源:科技云報道

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-07-24
未來10年的存儲創(chuàng)新,就被這個技術(shù)承包了
科技云報道原創(chuàng)。2019年,隨著在NVMe技術(shù)方面的突破和演進,超大規(guī)模數(shù)據(jù)中心和高性能計算用戶很快將從中受益。在后摩爾定律時期,在CPU性能增長放緩的背景下,NVMe技術(shù)以及NVMeoverf

長按掃碼 閱讀全文