123,123,123

2019年，隨著在NVMe技術(shù)方面的突破和演進，超大規(guī)模數(shù)據(jù)中心和高性能計算用戶很快將從中受益。在后摩爾定律時期，在CPU性能增長放緩的背景下，NVMe技術(shù)以及NVMe over fabric技術(shù)的發(fā)展，將成為推動IT技術(shù)創(chuàng)新的新動力。當(dāng)然，所有這一切背后都是有實際需求在推動。

翻開歷史來看，NVMe的發(fā)展可謂是非常迅速。2014年，第一批NVMe技術(shù)方案還只是服務(wù)器上的一個驅(qū)動而已，這個驅(qū)動負責(zé)處理存儲訪問操作。

如今，許多超大規(guī)模數(shù)據(jù)中心，做高性能計算解決方案的廠商都在節(jié)點上測試NVMe。由于NVMe的方案是針對節(jié)點規(guī)模擴展的，這就帶來很高的靈活性，同時還有非常高的性能提升優(yōu)化空間。

雖然NVMe對于那些需要用到非易失性存儲的應(yīng)用帶來了很大幫助，但是，下一階段NVMe over fabric的帶來的影響將更為深遠。

以太網(wǎng)的帶寬爆炸式增長，100GB/s還有400GB/s之類的似乎也都不遠了。存儲如果能用上這樣的能力，在服務(wù)器看來，就像是在本地一樣了。

市場上Mellanox，Pure Storage，Excelero都有類似的創(chuàng)新，以太網(wǎng)的方案整體來說都比較簡單，這些創(chuàng)新方案的思路就是用簡潔的方式來匯集存儲資源，雖然是遠程訪問，但是看起來就像是訪問本地存儲一樣。

降低存儲網(wǎng)絡(luò)復(fù)雜度帶來的好處非常明顯，它有助于打造更大規(guī)模存儲集群，用更少的資源做更多的事兒。

未來，隨著NVMe over fabrics成本大幅降低，NVMe將在技術(shù)方案和市場上釋放更大的能量。

成本下降，這意味著就可以投入大規(guī)模使用了。超大規(guī)模數(shù)據(jù)中心由于采購量大，可以用和SATA相同的價格用上NVMe，對于一般用戶來說，多花點錢用3GB/s帶寬替代500MB/s的SATA也非常合適。

雖說NVMe的成本會降低，前景一片大好，不過真正想把一個新技術(shù)推向市場，起碼市場上得有好幾個同類方案。大家一起來教育市場，然后才有向傳統(tǒng)存儲體系架構(gòu)發(fā)起挑戰(zhàn)的資格。

NVMe化解傳統(tǒng)存儲架構(gòu)的新挑戰(zhàn)

在市場上可以看到，Excelero在研究NVMe over fabric方面的技術(shù)，Mellanox，Pure Storage還有NetApp也在研究，具體的做法都不太一樣。不過，面對實際用戶需求，要解決的問題會有許多相似之處。

比如，Excelero有一家歐洲的大型銀行客戶，這家銀行需要跑SAS分析負載，依靠傳統(tǒng)方案做一些日常分析的話大概需要四十個小時，由于速度太慢，日常性的報告不能及時提供，以至于影響了歐盟的有關(guān)規(guī)定。

在這一場景下，單單說不怕浪費，多掛點NVMe盤已經(jīng)解決不了問題了。

這家銀行的方案是，在GPFS上構(gòu)建SAS網(wǎng)絡(luò)集群，同一時間可能有八個節(jié)點在同一個數(shù)據(jù)集上工作，數(shù)據(jù)集是不能分割的，由于這是延遲和帶寬敏感型應(yīng)用，當(dāng)對一天的數(shù)據(jù)進行檢索的時候，對存儲帶寬，隨機IO性能都提出了很高要求。

Excelero的方案提供的共享資源池正好解決了這一問題，降低了小IO讀寫的延遲，讀寫帶寬的主要瓶頸也就是網(wǎng)絡(luò)了。不過，生成分析報告的時間縮短到了6個小時。

Excelero的方案非常有代表性，值得借鑒，足以說明NVMe over fabric的價值點，使得用NVMe over fabric構(gòu)建的遠程存儲提供的共享資源池，能利用上像GPFS這樣的大規(guī)模并行系統(tǒng)。

集群存儲的另一種做法是，在每一個主機上都復(fù)制一份數(shù)據(jù)集。這種做法，首先資源開銷非常巨大，為了讓每份數(shù)據(jù)都保持一致，所以主機互聯(lián)的技術(shù)經(jīng)常需要傳輸大量的指令，效率非常低下，集中共享的存儲非常有必要。

類似的，一家名為CMA的公司正在研究用NVMe技術(shù)支持Oracle Exadata的集群方案。

NVIDIA的DGX系統(tǒng)能讓多個GDX-1同時工作，也是一個集群系統(tǒng)，也有人在思考如何讓GDX更好地用上NVMe的能力。

比如，金融領(lǐng)域有時候需要將一個工作負載分散到多臺DGX-1上，有的朋友可能會馬上想到DGX-1農(nóng)場，DGX-1農(nóng)場的問題是只能用SATA盤，如果換成NVMe的話，帶寬和延遲將發(fā)生非常大的變化。

雖然DGX-2開始支持NVMe了，但是數(shù)量非常有限，只能使用機箱里提供的那有限的幾塊NVMe SSD。

能不能讓所有的DGX-2都用到NVMe資源池，讓所有的機器都自由訪問共享內(nèi)存呢？這也是個有趣的問題。可能不久后，NVIDIA也會推出類似的方案。

人工智能場景將成為推動

NVMe存儲創(chuàng)新的一大動力

人工智能將是推動NVMe over fabric發(fā)展的又一大因素。人工智能技術(shù)的發(fā)展，對于那些做算法回溯測試，還有做醫(yī)學(xué)成像、地理信息系統(tǒng)(GIS)的行業(yè)帶來了很大幫助。

但是由于訓(xùn)練時候需要處理大量圖像，這對于存儲帶來很大挑戰(zhàn)，人工智能的能力受到了限制。

雖然有ResNet這樣的基準(zhǔn)測試會使用許多小的圖片來做測試，讓人看到一些性能表現(xiàn)，但在很多時候，真正用的其實有很多大圖像。

比如，MRI還有衛(wèi)星圖像的分辨率非常大，圖像大小可能是好幾兆甚至幾十兆，拿這些數(shù)據(jù)來做訓(xùn)練的話，對存儲系統(tǒng)的延遲和帶寬要求是非常高的。

在銀行的賬戶交易系統(tǒng)中，也需要擴展集群來處理實時的請求，構(gòu)建一個集中的資源池來應(yīng)對隨機訪問需求。如果是一個幾十TB的數(shù)據(jù)集，不可能在每個主機上復(fù)制一份數(shù)據(jù)并且及時同步數(shù)據(jù)，唯一合理的做法是搭建一個獨立的存儲資源池。

簡單來說，NVMe之所以將獲得飛速發(fā)展，核心原因還是需求推動的，那些特定工作負載，還有業(yè)務(wù)量巨大的公司都必須重新構(gòu)建基礎(chǔ)架構(gòu)。

如今的IT領(lǐng)域，主流的創(chuàng)新主要來自云和超大規(guī)模數(shù)據(jù)中心領(lǐng)域，新技術(shù)很多時候都會在這一領(lǐng)域出現(xiàn)或者發(fā)揚光大，NVMe的發(fā)展也將隨之爆發(fā)。

但因為現(xiàn)有IT架構(gòu)的影響以及新的解決方案的成熟度，想真正在市場上看到NVMe的能力還得再等等。

可以肯定的是，NVMe將帶來許多新的突破，這個突破將對IT領(lǐng)域影響深遠，是否是影響未來十年的技術(shù)也未可知。

【科技云報道原創(chuàng)】

微信公眾賬號：科技云報道

來源：科技云報道

免責(zé)聲明：此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章，所有文字和圖片版權(quán)歸作者所有，且僅代表作者個人觀點，與極客網(wǎng)無關(guān)。文章僅供讀者參考，并請自行核實相關(guān)內(nèi)容。投訴郵箱：editor@fromgeek.com。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

未來10年的存儲創(chuàng)新，就被這個技術(shù)承包了

下一篇