想成為大數(shù)據(jù)驅(qū)動(dòng)型組織,應(yīng)該如何選擇存儲(chǔ)系統(tǒng)?

原標(biāo)題:想成為大數(shù)據(jù)驅(qū)動(dòng)型組織,應(yīng)該如何選擇存儲(chǔ)系統(tǒng)?

面對(duì)數(shù)據(jù)增長(zhǎng)帶來(lái)的嚴(yán)峻挑戰(zhàn),企業(yè)要想以大數(shù)據(jù)驅(qū)動(dòng)持續(xù)業(yè)務(wù)發(fā)展,應(yīng)該選擇什么樣的存儲(chǔ)系統(tǒng)?

數(shù)據(jù)增長(zhǎng)帶來(lái)的嚴(yán)峻挑戰(zhàn)

隨著大數(shù)據(jù)時(shí)代的來(lái)臨,企業(yè)數(shù)據(jù)團(tuán)隊(duì)如今每天需要處理的數(shù)據(jù),已經(jīng)超越了以往的任何時(shí)候。

據(jù)統(tǒng)計(jì),2020年一小時(shí)產(chǎn)生的數(shù)據(jù),比2000年全年產(chǎn)生的數(shù)據(jù)還多。未來(lái)3年全球產(chǎn)生的數(shù)據(jù),將會(huì)比過(guò)去30年的還要多。數(shù)據(jù)的急劇增長(zhǎng),也給企業(yè)帶來(lái)了極為嚴(yán)峻的挑戰(zhàn)。

舉例來(lái)說(shuō),需求最嚴(yán)苛的非結(jié)構(gòu)化數(shù)據(jù)工作負(fù)載,譬如大量的圖形和視頻文件,分析、研究、基因組學(xué)和人工智能數(shù)據(jù)的大型存儲(chǔ)庫(kù),半導(dǎo)體電子設(shè)計(jì)自動(dòng)化,HPC高性能計(jì)算,以及許多其他計(jì)算場(chǎng)景等,讓許多企業(yè)的存儲(chǔ)系統(tǒng)顯得捉襟見(jiàn)肘,疲于奔命。因?yàn)檫@些工作負(fù)載需要大量的CPU和GPU處理能力,并且需要系統(tǒng)具備無(wú)縫擴(kuò)展容量和性能的能力。

不過(guò),數(shù)據(jù)增長(zhǎng)在給企業(yè)帶來(lái)挑戰(zhàn)的同時(shí),也為企業(yè)開(kāi)啟了更多的機(jī)遇。來(lái)自麥肯錫咨詢公司的一份分析報(bào)告指出,擅長(zhǎng)利用大數(shù)據(jù)價(jià)值的企業(yè)組織將獲得持續(xù)發(fā)展動(dòng)能。這些能力涵蓋了以下幾個(gè)方面:一是更容易獲取新的客戶資源(多達(dá)23倍);二是更好地保留老客戶(多達(dá)6倍);三是在市場(chǎng)份額上獲得更好的成長(zhǎng)(多達(dá)19倍)。

顯而易見(jiàn)的是,與沒(méi)有充分利用大數(shù)據(jù)分析平臺(tái)的傳統(tǒng)企業(yè)相比,大數(shù)據(jù)驅(qū)動(dòng)型的企業(yè)組織能夠獲得更多的受益。因此對(duì)于廣大企業(yè)來(lái)說(shuō),這是一個(gè)挑戰(zhàn)與機(jī)遇并存的時(shí)代。

配置存儲(chǔ)系統(tǒng)時(shí)的考量因素

眾所周知,數(shù)據(jù)正在成為現(xiàn)代企業(yè)的核心資產(chǎn)。全球知名咨詢機(jī)構(gòu)IDC的分析也指出,企業(yè)在通過(guò)加速創(chuàng)新的數(shù)據(jù)分析計(jì)劃,來(lái)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型重要階段和改善業(yè)務(wù)指標(biāo)時(shí),應(yīng)該做好擴(kuò)大數(shù)據(jù)存儲(chǔ)的準(zhǔn)備。那么面對(duì)飛速增長(zhǎng)的數(shù)據(jù),企業(yè)在配置存儲(chǔ)系統(tǒng)時(shí),應(yīng)當(dāng)重點(diǎn)考慮哪些方面的因素?

戴爾科技集團(tuán)大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)事業(yè)部高級(jí)經(jīng)理李海表示,企業(yè)在搭建數(shù)據(jù)化平臺(tái)的時(shí)候,應(yīng)該著重考慮的要點(diǎn)包括有數(shù)據(jù)的安全性,數(shù)據(jù)的有效性,數(shù)據(jù)的及時(shí)可用,以及數(shù)據(jù)的延伸性、擴(kuò)展性等等。

“企業(yè)在選擇存儲(chǔ)系統(tǒng)時(shí),應(yīng)該充分考慮自己的數(shù)據(jù)能不能隨著業(yè)務(wù)的增長(zhǎng)而得到迅速的擴(kuò)張。譬如你今天的數(shù)據(jù)可能只有100PB,但是下個(gè)月就可能是300PB,你的存儲(chǔ)架構(gòu)是不是具備這樣的彈性?是不是能夠滿足自身業(yè)務(wù)的數(shù)據(jù)增長(zhǎng)?而且還是不同維度的增長(zhǎng)?”李海說(shuō)道。

李海接著指出,有時(shí)候企業(yè)數(shù)據(jù)量雖然沒(méi)有多少變化,但是算力需求也會(huì)出現(xiàn)突然增長(zhǎng)。譬如一家企業(yè)的數(shù)據(jù)可能今天需要的算力是“1”,但是明天需要的算力就突然變成了“10”。但另外一些用戶又不一樣,其需要的算力可能是固定的,但是數(shù)據(jù)則會(huì)出現(xiàn)不同時(shí)間點(diǎn)的跳躍。因此對(duì)于企業(yè)來(lái)說(shuō),無(wú)論是計(jì)算還是存儲(chǔ)都需要不同的彈性,這些都是企業(yè)需要重點(diǎn)考慮的因素。

Cloudera的最高級(jí)別認(rèn)證

怎樣才能幫助企業(yè)應(yīng)對(duì)數(shù)據(jù)增長(zhǎng)帶來(lái)的嚴(yán)峻挑戰(zhàn)?如何在激烈的市場(chǎng)競(jìng)爭(zhēng)中利用大數(shù)據(jù)驅(qū)動(dòng)企業(yè)持續(xù)發(fā)展?怎樣保障數(shù)據(jù)的安全性?如何有效地治理數(shù)據(jù)?怎樣去做快照、復(fù)制和容災(zāi)?幫助企業(yè)解決這些問(wèn)題,就是戴爾科技集團(tuán)與Cloudera兩家公司聯(lián)合起來(lái)要做的事情。

2021年5月7日,Cloudera宣布在Cloudera Data Platform私有云版本上成功完成了Dell EMC PowerScale/Isilon 8.2.2質(zhì)量控制測(cè)試套件(QATS)認(rèn)證?,F(xiàn)在,使用Dell EMC PowerScale與Cloudera Data Hub或Hortonworks Data Platform的客戶,在遷移至業(yè)內(nèi)首個(gè)企業(yè)數(shù)據(jù)云Cloudera Data Platform時(shí)可獲得延展的技術(shù)支持。

值得一提的是,該質(zhì)量保證測(cè)試套件(QATS)流程是Cloudera的最高級(jí)別認(rèn)證,可對(duì)所有Cloudera產(chǎn)品套件的軟件文檔系統(tǒng)、新一代硬件和容器進(jìn)行嚴(yán)格的測(cè)試。該認(rèn)證緊跟多項(xiàng)幫助企業(yè)保持敏捷性和貼近數(shù)據(jù)的主要趨勢(shì),包括存儲(chǔ)與計(jì)算解耦,虛擬化和容器化部署的快速采用,以及作為底層存儲(chǔ)的對(duì)象存儲(chǔ)日益普及。Dell EMC PowerScale上的Cloudera Data Platform可幫助企業(yè)整合最具靈活性、可擴(kuò)展性、成本效益以及能夠隨時(shí)隨訪問(wèn)數(shù)據(jù)的共享存儲(chǔ)配置。

“QATS認(rèn)證的好處是什么?就是幫助企業(yè)在搭建大數(shù)據(jù)平臺(tái)選擇我們兩家的解決方案時(shí),不需要再去做很多的驗(yàn)證,不需要再考慮我們兩家模塊上的契合度問(wèn)題,因?yàn)槲覀円呀?jīng)做過(guò)大量的認(rèn)證,包括每個(gè)模塊、每個(gè)應(yīng)用、每個(gè)訪問(wèn)、每種協(xié)議都已經(jīng)幫客戶驗(yàn)證過(guò)了,而且我們?cè)趯?shí)驗(yàn)室里模擬了很多環(huán)境,并且在運(yùn)行中產(chǎn)生了大量的實(shí)踐性的數(shù)據(jù)指南,從而會(huì)后繼衍生出如何部署、調(diào)優(yōu)、實(shí)現(xiàn),提供大量的資料,來(lái)配合后期的用戶去實(shí)現(xiàn)更好的搭建。這也是我們這次最高級(jí)別認(rèn)證的含義,它不是一個(gè)簡(jiǎn)單的硬件和軟件兼容性的認(rèn)證,而是兩個(gè)生態(tài)之間的契合性的認(rèn)證,每個(gè)環(huán)節(jié)都實(shí)現(xiàn)了無(wú)縫契合。”李海表示。

“面對(duì)客戶不同的需求和復(fù)雜的應(yīng)用場(chǎng)景,要配合做QATS這樣的最高級(jí)別測(cè)試,一定要深度的合作才可以做到。如果任意拿到一個(gè)廠商的界面上去做,很可能會(huì)出現(xiàn)各種各樣的性能問(wèn)題或者安全問(wèn)題,讓客戶心急如焚又不知所措。而戴爾科技集團(tuán)與Cloudera兩家后臺(tái)的實(shí)驗(yàn)室是互通的,這是建立在長(zhǎng)期的合作基礎(chǔ)上的,大家在溝通上有一致的語(yǔ)言,才能實(shí)現(xiàn)無(wú)縫契合和企業(yè)級(jí)的響應(yīng),這對(duì)于提升客戶的滿意度來(lái)說(shuō)非常重要?!盋loudera大中華區(qū)售前技術(shù)總監(jiān)劉隸放表示。

全閃存陣容再添新成員

伴隨著數(shù)據(jù)基建市場(chǎng)的蓬勃增長(zhǎng),在經(jīng)過(guò)對(duì)相關(guān)業(yè)內(nèi)人士的調(diào)查之后,美國(guó)知名科技企業(yè)風(fēng)投機(jī)構(gòu)A16Z得出結(jié)論:一個(gè)現(xiàn)代化數(shù)據(jù)架構(gòu)中,數(shù)據(jù)湖已成為數(shù)據(jù)分析架構(gòu)中的中流砥柱,赫然在列數(shù)據(jù)分析架構(gòu)的核心位置。

作為企業(yè),自然都希望自己的文件存儲(chǔ)系統(tǒng)能夠跟得上數(shù)字業(yè)務(wù)不可預(yù)測(cè)的需求。而數(shù)據(jù)本地化、性能和經(jīng)驗(yàn)證的技術(shù),則是面向AI場(chǎng)景對(duì)基礎(chǔ)設(shè)施的前三大考量因素。

來(lái)自ESG(Enterprise Strategy Group,企業(yè)戰(zhàn)略集團(tuán))最近的一項(xiàng)研究發(fā)現(xiàn),為了跟上數(shù)字業(yè)務(wù)的需求,用于非結(jié)構(gòu)化數(shù)據(jù)的大數(shù)據(jù)/數(shù)據(jù)湖存儲(chǔ)庫(kù)是受訪者投資最多的三個(gè)工作負(fù)載場(chǎng)景之一。要想充分釋放數(shù)據(jù)的商業(yè)潛力,文件存儲(chǔ)不僅要足夠大,還必須速度快,易管理。這些需求正帶來(lái)全閃存數(shù)據(jù)湖的增長(zhǎng)。

戴爾科技集團(tuán)迄今為止最強(qiáng)大的節(jié)點(diǎn)Dell EMC PowerScale F900,正是為現(xiàn)代化高性能數(shù)據(jù)湖而生。

作為戴爾科技集團(tuán)旗下屢獲殊榮的PowerScale全閃存陣容新成員,F(xiàn)900配有dual-socket的cascade lake處理器、全NVMe閃存并兼容NVIDIA GPUDirect,以處理最數(shù)據(jù)密集型的工作負(fù)載,并且擁有更大的靈活性和更多的可選擇配置。

而對(duì)于企業(yè)來(lái)說(shuō),基于強(qiáng)大的PowerScale OneFS操作系統(tǒng),可以輕松添加新的F900節(jié)點(diǎn)或用新的PowerScale節(jié)點(diǎn)替換舊節(jié)點(diǎn),還能與現(xiàn)有的Isilon集群無(wú)縫兼容。而通過(guò)Dell EMC PowerScale F900,企業(yè)不僅可以獲得更強(qiáng)大的功能和擴(kuò)展能力,而且還能夠從戴爾科技集團(tuán)擁有超過(guò)250家ISV合作伙伴集成和認(rèn)證的強(qiáng)大生態(tài)系統(tǒng)中獲益。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2021-07-07
想成為大數(shù)據(jù)驅(qū)動(dòng)型組織,應(yīng)該如何選擇存儲(chǔ)系統(tǒng)?
就是幫助企業(yè)在搭建大數(shù)據(jù)平臺(tái)選擇我們兩家的解決方案時(shí),不需要再去做很多的驗(yàn)證,不需要再考慮我們兩家模塊上的契合度問(wèn)題,因?yàn)槲覀円呀?jīng)做過(guò)大量的認(rèn)證,包括每個(gè)模塊、每個(gè)應(yīng)用、每個(gè)訪問(wèn)、每種協(xié)議都已經(jīng)幫客戶

長(zhǎng)按掃碼 閱讀全文