人工智能技術(shù)將極大地改變各行各業(yè)的面貌,企業(yè)級(jí)存儲(chǔ)領(lǐng)域也是這樣。
近幾年,存儲(chǔ)領(lǐng)域最火的軟件定義存儲(chǔ)、智能存儲(chǔ)等概念背后,都有一個(gè)關(guān)鍵詞——智能化。原因就在于,越來(lái)越多的企業(yè)已經(jīng)意識(shí)到,相比擁有數(shù)據(jù)而言,善于利用數(shù)據(jù)、從數(shù)據(jù)中獲取價(jià)值,才是真正的競(jìng)爭(zhēng)優(yōu)勢(shì)。
2019年下半年,IBM發(fā)布了一系列面向AI與大數(shù)據(jù)、現(xiàn)代數(shù)據(jù)保護(hù)的新一代軟件定義存儲(chǔ)產(chǎn)品,致力于借助AI技術(shù),跨越時(shí)空幫企業(yè)管好數(shù)據(jù)。
未來(lái)企業(yè)級(jí)存儲(chǔ)的挑戰(zhàn)是什么?什么是新一代軟件定義存儲(chǔ)?IBM存儲(chǔ)的優(yōu)勢(shì)和策略又是什么?帶著以上這些問(wèn)題,趣味科技于近日采訪了IBM副總裁、大中華區(qū)系統(tǒng)部總經(jīng)理侯淼和IBM大中華區(qū)系統(tǒng)部存儲(chǔ)系統(tǒng)總經(jīng)理吳磊。
IBM副總裁、大中華區(qū)系統(tǒng)部總經(jīng)理侯淼
新挑戰(zhàn):當(dāng)數(shù)據(jù)活得越來(lái)越久
“數(shù)據(jù)的發(fā)展有兩大趨勢(shì):一個(gè)是數(shù)據(jù)越來(lái)越多,也就是大家都熟悉的數(shù)據(jù)大爆炸;還有一個(gè)維度,就是數(shù)據(jù)的生命周期正在變得越來(lái)越長(zhǎng)?!盜BM副總裁、大中華區(qū)系統(tǒng)部總經(jīng)理侯淼表示。
如果按使用頻率劃分,數(shù)據(jù)可以用一張冰山圖來(lái)表示。露出水面的冰山一角是一級(jí)存儲(chǔ)(Primary Storage),針對(duì)熱數(shù)據(jù)和溫?cái)?shù)據(jù),比如需要高IOPs、低時(shí)延、高性能計(jì)算分析的實(shí)時(shí)數(shù)據(jù)。冰山的水下部分是二級(jí)存儲(chǔ)(Secondary Storage),針對(duì)冷數(shù)據(jù),比如用于歸檔、備份的數(shù)據(jù)、媒體與圖像資料庫(kù)、物聯(lián)網(wǎng)數(shù)據(jù)等。有數(shù)據(jù)統(tǒng)計(jì),二級(jí)存儲(chǔ)約占企業(yè)存儲(chǔ)的70%。
隨著信息安全法規(guī)和金融、醫(yī)療等行業(yè)不斷加強(qiáng)數(shù)據(jù)監(jiān)管,企業(yè)對(duì)數(shù)據(jù)留存時(shí)間的要求越來(lái)越高,水面之下的冰山部分越來(lái)越大。2016年《反恐法》規(guī)定,重要場(chǎng)所視頻監(jiān)控圖像保持期限不得少于90天。銀監(jiān)會(huì)規(guī)定,理財(cái)產(chǎn)品的數(shù)據(jù)要在結(jié)束后的2年內(nèi)進(jìn)行保留歸檔。一些能源制造企業(yè),在生產(chǎn)環(huán)境下要求對(duì)數(shù)據(jù)有五年、十年,甚至數(shù)十年的保存。
數(shù)據(jù)爆炸與周期變長(zhǎng)的疊加,以及AI和大數(shù)據(jù)進(jìn)入生產(chǎn)環(huán)境,都在不斷推高企業(yè)對(duì)數(shù)據(jù)存儲(chǔ)的要求。IBM大中華區(qū)系統(tǒng)部存儲(chǔ)系統(tǒng)總經(jīng)理吳磊認(rèn)為,企業(yè)級(jí)存儲(chǔ)面臨的新挑戰(zhàn)表現(xiàn)在多個(gè)方面:
首先,人工智能、大數(shù)據(jù)技術(shù)已經(jīng)從POC(概念驗(yàn)證)環(huán)節(jié)進(jìn)入生產(chǎn)環(huán)節(jié)。在全新的應(yīng)用場(chǎng)景中,海量數(shù)據(jù)正源源不斷涌現(xiàn)。多元數(shù)據(jù)的攝取,準(zhǔn)備的周期非常長(zhǎng)。
其次,越來(lái)越多的企業(yè)選擇混合多云的環(huán)境部署業(yè)務(wù),如何把傳統(tǒng)數(shù)據(jù)中心,傳統(tǒng)應(yīng)用,不同云環(huán)境等不同IT環(huán)境的數(shù)據(jù)打通是個(gè)大挑戰(zhàn)。同時(shí),面對(duì)不同架構(gòu)多災(zāi)備的數(shù)據(jù)副本,如何保證數(shù)據(jù)單一的真實(shí)性來(lái)源也是痛點(diǎn)。
第三,如何保護(hù)數(shù)據(jù)在更長(zhǎng)久周期內(nèi)的可用、可回溯性、可審計(jì)性。
IBM大中華區(qū)系統(tǒng)部存儲(chǔ)系統(tǒng)總經(jīng)理吳磊
如何解決這些新挑戰(zhàn)?IBM將存儲(chǔ)產(chǎn)品從功能上劃分為兩大維度,一個(gè)是數(shù)據(jù)存儲(chǔ),一個(gè)是數(shù)據(jù)訪問(wèn)。數(shù)據(jù)存儲(chǔ)方面,IBM追求跨越時(shí)空和性價(jià)比。即使數(shù)據(jù)容量漲得很快,也能保持企業(yè)的IT投資處在合理水平。在數(shù)據(jù)訪問(wèn)方面,強(qiáng)調(diào)用AI技術(shù)打造從數(shù)據(jù)獲取價(jià)值的極速管道。
“IBM是全球存儲(chǔ)產(chǎn)品最豐富的公司。IBM存儲(chǔ)分為四大部分:第一,storage for multi hybrid cloud,面向混合多云環(huán)境的存儲(chǔ)構(gòu)架;第二,Storage for AI and Big Data,針對(duì)人工智能和大數(shù)據(jù)的存儲(chǔ);第三,Modern Data Protection,圍繞我們Spectrum Protection和Protection Plus軟件系統(tǒng)的現(xiàn)代數(shù)據(jù)保護(hù);第四,Storage for Z,與主機(jī)結(jié)合的存儲(chǔ)?!焙铐到榻B。
新管道:如何加速AI燃料充分“燃燒”?
在算法、算力、數(shù)據(jù)三要素中,數(shù)據(jù)是AI的燃料。反過(guò)來(lái),“AI的關(guān)鍵是將數(shù)據(jù)轉(zhuǎn)變?yōu)樯a(chǎn)力?!眳抢谥赋觥?/p>
然而,在傳統(tǒng)存儲(chǔ)架構(gòu)下,從數(shù)據(jù)到生產(chǎn)力的管道卻經(jīng)常堵塞。比如在不同介質(zhì)、異構(gòu)架構(gòu)的元數(shù)據(jù)源攝取上,如果無(wú)法做到全球范圍、快速數(shù)據(jù)攝取和實(shí)時(shí)分析,有再好的CPU、GPU、FPGA也無(wú)法發(fā)揮數(shù)據(jù)價(jià)值。再比如,在數(shù)據(jù)分類與元數(shù)據(jù)標(biāo)注上,數(shù)據(jù)的攝取、準(zhǔn)備的周期非常長(zhǎng),極大影響了AI模型訓(xùn)練的效率。也就是說(shuō),數(shù)據(jù)從入口進(jìn)來(lái)的太慢,已經(jīng)成為AI技術(shù)落地的一個(gè)瓶頸。
IBM本次發(fā)布了端到端的NVMe解決方案IBM Elastic StorageSystem 3000(ESS 3000)以及元數(shù)據(jù)管理軟件IBM Spectrum Discover,專為人工智能和大數(shù)據(jù)工作負(fù)載打造。二者的組合打通了數(shù)據(jù)攝取、分類標(biāo)注、數(shù)據(jù)分析、數(shù)據(jù)訓(xùn)練在內(nèi)的高速管道,打造了適用于任何高I/O吞吐的生產(chǎn)級(jí)人工智能大數(shù)據(jù)分析平臺(tái)。
ESS 3000被稱為“為AI和大數(shù)據(jù)實(shí)現(xiàn)快速、高度可擴(kuò)展存儲(chǔ)部署的最簡(jiǎn)單方法”。ESS 3000的核心優(yōu)勢(shì)可以用高性能、高擴(kuò)展、簡(jiǎn)單部署來(lái)概括。
首先,ESS 3000采用NVMe閃存存儲(chǔ),每個(gè)2U構(gòu)建塊可提供40GB/s的吞吐量。順序讀取性能最高可達(dá)42GB/s,順序?qū)懭胄阅茏罡呖蛇_(dá)32GB/s。
其次,ESS 3000的核心技術(shù)是IBM Spectrum Scale。IBM Spectrum Scale是IBM經(jīng)歷多年企業(yè)級(jí)生產(chǎn)環(huán)境驗(yàn)證的并行文件存儲(chǔ)系統(tǒng),其代碼迭代超過(guò)20年。從名字可以看出,IBM Spectrum Scale的無(wú)縫擴(kuò)展功能可以應(yīng)對(duì)海量非結(jié)構(gòu)化數(shù)據(jù)的增長(zhǎng)。
第三,ESS 3000透過(guò)容器化技術(shù)把IBM Spectrum Scale封裝在全閃存設(shè)備中,帶來(lái)開(kāi)箱即用的簡(jiǎn)單部署。企業(yè)部署時(shí)間可以從原來(lái)的數(shù)天降低到幾個(gè)小時(shí)。
元數(shù)據(jù)管理軟件IBM Spectrum Discover能夠?qū)σ?guī)模級(jí)數(shù)據(jù)快速識(shí)別、分類,可以快速攝入、合并數(shù)十億個(gè)文件和對(duì)象的元數(shù)據(jù)并對(duì)其進(jìn)行索引處理。IBM Spectrum Discover的作用在于幫助數(shù)據(jù)科學(xué)家、數(shù)據(jù)管理者高效管理海量非結(jié)構(gòu)化數(shù)據(jù),從數(shù)據(jù)中快速挖掘價(jià)值。
此外,在智能化存儲(chǔ)管理方面,IBM Spectrum Control可以借助AI技術(shù)自動(dòng)化進(jìn)行存儲(chǔ)性能、安全性的監(jiān)控和分析,并與IBM成熟的存儲(chǔ)管理經(jīng)驗(yàn)公式進(jìn)行比照,為客戶提供預(yù)測(cè)性故障分析。
老傳統(tǒng):跨越時(shí)空幫企業(yè)管好數(shù)據(jù)
提到能夠跨越時(shí)空的物質(zhì),很多人會(huì)想到石頭。“一顆恒久遠(yuǎn)”的鉆石就是石頭。小說(shuō)《三體》中,云天明把幾行字刻在石頭上,過(guò)了1800萬(wàn)年之后還能被程心看到。
在時(shí)間維度上,當(dāng)數(shù)據(jù)的壽命越來(lái)越長(zhǎng),企業(yè)必然希望數(shù)據(jù)能夠長(zhǎng)久保存,磁帶這一種傳統(tǒng)的存儲(chǔ)方式煥發(fā)出了新的活力。很多人以為磁帶技術(shù)早已淘汰過(guò)時(shí),吳磊舉了一個(gè)簡(jiǎn)單的例子說(shuō)明磁帶保存數(shù)據(jù)的長(zhǎng)期性和可靠性。
一家全球的科研機(jī)構(gòu),在幾年前要把過(guò)去十年存儲(chǔ)在磁帶上的數(shù)據(jù)梳理一遍。這些帶子總共幾萬(wàn)盤,總長(zhǎng)度2200萬(wàn)米。除了200多米長(zhǎng)的數(shù)據(jù)讀不出來(lái),其他數(shù)據(jù)都完好無(wú)缺。
相比只能保存2-3年的硬盤,保存十年卻只有大約十萬(wàn)分之一的損壞率,足以說(shuō)明磁帶存儲(chǔ)的經(jīng)久耐用。而且斷裂的磁帶可以重新接上進(jìn)行修復(fù),而硬盤類存儲(chǔ)一旦損壞數(shù)據(jù)就全部找不回來(lái)。在成本上,磁帶存儲(chǔ)比硬盤便宜80%-90%左右。對(duì)于海量歸檔、備份屬性的二級(jí)存儲(chǔ)數(shù)據(jù),磁帶存儲(chǔ)是更可靠、更便宜、壽命更長(zhǎng)、更安全(隔離網(wǎng)絡(luò),天然防止黑客攻擊)的解決方案。
吳磊介紹,作為全球僅有的幾家具備磁帶存儲(chǔ)解決方案的企業(yè),IBM也在不斷升級(jí)磁帶技術(shù)。IBM不但將磁帶密度越做越高,還通過(guò)磁帶文件系統(tǒng)IBM Spectrum Archive,實(shí)現(xiàn)了軟件定義的磁帶解決方案,可以對(duì)磁帶數(shù)據(jù)智能回溯,方便調(diào)取歷史數(shù)據(jù)。目前,IBM的磁帶存儲(chǔ)在電視臺(tái)、網(wǎng)絡(luò)音頻、視頻公司都有廣泛使用。
在空間維度上,IBM存儲(chǔ)針對(duì)混合多云的環(huán)境打造了跨數(shù)據(jù)中心和云的統(tǒng)一存儲(chǔ)管理。IBM Spectrum Scale可將閃存、磁盤、云和磁帶存儲(chǔ)合并到一個(gè)統(tǒng)一的系統(tǒng)之中,實(shí)現(xiàn)規(guī)?;臄?shù)據(jù)管理。IBM Spectrum Discover可輕松連接至內(nèi)部環(huán)境和云環(huán)境中的多個(gè)文件與對(duì)象存儲(chǔ)系統(tǒng)。在數(shù)據(jù)保護(hù)方面,IBM Spectrum Protect Plus是專為混合多云環(huán)境而設(shè)計(jì)的一體化數(shù)據(jù)保護(hù)解決方案,可以快速恢復(fù) VM、數(shù)據(jù)庫(kù)、應(yīng)用和容器。
此外,SVC(SAN Volume Controller)可以利用IBM Spectrum Virtualize for Public Cloud的廣泛功能,簡(jiǎn)化多云解決方案,實(shí)現(xiàn)異構(gòu)存儲(chǔ)全面云化。IBM第二代對(duì)象存儲(chǔ)COS(Cloud Object Storage)采用標(biāo)準(zhǔn)的S3接口,可以無(wú)縫訪問(wèn)本地和云端的對(duì)象存儲(chǔ)。
在交付方式上,IBM為企業(yè)提供一體機(jī)和純軟件交付靈活組合的方式??梢哉f(shuō),在新的存儲(chǔ)挑戰(zhàn)下,IBM用實(shí)力詮釋了新一代軟件定義存儲(chǔ)的概念。同時(shí)也體現(xiàn)了IBM存儲(chǔ)的三大優(yōu)勢(shì):現(xiàn)代化,現(xiàn)代化基礎(chǔ)架構(gòu)下,不斷迭代推出更新的閃存技術(shù);敏捷,在混合多云環(huán)境下做到容器化的封裝,靈活可擴(kuò)展,極簡(jiǎn)部署;安全,更長(zhǎng)周期的數(shù)據(jù)存儲(chǔ)和更可靠的數(shù)據(jù)保護(hù)。
“數(shù)據(jù)是客戶唯一的唯一,我們的工作就是跨越時(shí)空,把客戶針對(duì)數(shù)據(jù)所有的事情做好,做扎實(shí)?!眳抢趶?qiáng)調(diào)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )