“過去,傳統(tǒng)醫(yī)學(xué)主要依靠個人經(jīng)驗,醫(yī)生根據(jù)自身實踐經(jīng)驗和嘗試不同方案來做診斷與治療;如今,精準(zhǔn)醫(yī)學(xué)的醫(yī)療過程則是依靠數(shù)據(jù),在海量數(shù)據(jù)基礎(chǔ)上利用大數(shù)據(jù)、AI等技術(shù)實現(xiàn)個性化治療?!蹦戏侥尘珳?zhǔn)醫(yī)學(xué)中心計算腫瘤學(xué)博士去年向大數(shù)據(jù)在線如是說。
的確,數(shù)字化大浪潮之下,數(shù)據(jù)正在改變一切。尤其是隨著數(shù)字經(jīng)濟的蓬勃發(fā)展,企業(yè)數(shù)字化轉(zhuǎn)型逐步走向深入,數(shù)據(jù)驅(qū)動+智能技術(shù)正在重塑企業(yè)的組織、流程、運營、管理甚至決策。與前些年的CRM、ERP流程數(shù)字化相比,如今的數(shù)據(jù)驅(qū)動型應(yīng)用建立在海量非結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)之上,并且通常融合了大數(shù)據(jù)、AI、物聯(lián)網(wǎng)、云計算等多種技術(shù)。
這些趨勢不僅讓海量數(shù)據(jù)存儲的重要性日益突出,也推動著海量數(shù)據(jù)存儲加速變革。在眾多海量數(shù)據(jù)存儲產(chǎn)品中,有海量數(shù)據(jù)之王之稱的Dell PowerScale堪稱排頭兵,在容量、擴展性、性能、可靠性、安全性、云環(huán)境等多個方面樹立業(yè)界標(biāo)桿,讓企業(yè)數(shù)字化和智能化轉(zhuǎn)型有“數(shù)”有“據(jù)”。
正如戴爾大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲事業(yè)部總經(jīng)理劉志洪所言:“在金融、醫(yī)療、生命科學(xué)、科研、制造等領(lǐng)域中,非結(jié)構(gòu)化數(shù)據(jù)所支撐的應(yīng)用正在迅速成為關(guān)鍵型應(yīng)用,海量存儲正在成為企業(yè)數(shù)字化和智能化轉(zhuǎn)型的堅實底座?!?/p>
現(xiàn)代化應(yīng)用呼喚新底座
隨著云計算、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)、邊緣計算等新一代數(shù)字化技術(shù)融入到千行百業(yè)的業(yè)務(wù)場景之中,不僅讓現(xiàn)代化應(yīng)用大量涌現(xiàn),也著實誕生了越來越多的海量非結(jié)構(gòu)化數(shù)據(jù)。IDC預(yù)測,到2025年80%的數(shù)據(jù)將是非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)所蘊含的價值不可低估。
戴爾大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲事業(yè)部總經(jīng)理劉志洪
現(xiàn)代化應(yīng)用往往具有部署環(huán)境廣泛、業(yè)務(wù)彈性多變、管理復(fù)雜和安全性要求極高等特征,也讓海量非結(jié)構(gòu)化數(shù)據(jù)的存儲、管理和分析挖掘變得愈發(fā)困難,具體表現(xiàn)為:
數(shù)據(jù)產(chǎn)生和使用的環(huán)境今非昔比。過去企業(yè)的數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)為主,主要產(chǎn)生在數(shù)據(jù)中心之中;如今,從邊緣、核心數(shù)據(jù)中心到云都在產(chǎn)生大量數(shù)據(jù),而且以種類豐富、大小多樣的非結(jié)構(gòu)化數(shù)據(jù)為主。Gartner數(shù)據(jù)顯示,到2025年有75%的企業(yè)所生成的數(shù)據(jù)會在數(shù)據(jù)中心或云之外進行創(chuàng)建或處理。
應(yīng)用的多樣性和復(fù)雜性遠超過往。大量現(xiàn)代化應(yīng)用所產(chǎn)生的數(shù)據(jù)量、對于數(shù)據(jù)處理性能的需求巨大,而且管理發(fā)展與日俱增。例如,自動駕駛在模擬和驗證階段的數(shù)據(jù)量高達數(shù)百PB,對于底層數(shù)據(jù)存儲的性能、容量考驗極大;又如,如今融入日常生活的健康碼,背后是數(shù)以億計的小圖片文件,帶來了前所未有的并發(fā)性能要求和管理復(fù)雜性。
數(shù)據(jù)跨核心、邊緣、云以及非結(jié)構(gòu)化數(shù)據(jù)價值的不斷凸顯,外加上愈發(fā)嚴格的法律法規(guī),外部惡意攻擊與勒索頻繁,使得企業(yè)的數(shù)據(jù)安全重要性前所未有。例如,在自動駕駛領(lǐng)域,自動駕駛訓(xùn)練的海量數(shù)據(jù)根據(jù)法律法規(guī)需求需要保存數(shù)十年之久;而2021年全球企業(yè)面臨的勒索病毒攻擊就超過6億次,這一切讓數(shù)據(jù)安全防護成為必修課。
這些趨勢使得海量數(shù)據(jù)存儲加速走向變革,成為數(shù)字化轉(zhuǎn)型最為牢固的底座。劉志洪認為:“在數(shù)字化時代,數(shù)據(jù)的紅利開始顯現(xiàn)。如何利用好數(shù)據(jù)+智能,抓住數(shù)據(jù)的紅利,是很多企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵所在。DELL 憑借在海量數(shù)據(jù)存儲領(lǐng)域二十余年的領(lǐng)先經(jīng)驗,已經(jīng)成為越來越多行業(yè)用戶激發(fā)數(shù)據(jù)潛能的首選?!?/p>
Dell PowerScale:海量數(shù)據(jù)之王
海量數(shù)據(jù)存儲并不是新鮮產(chǎn)品,自二十年前集群NAS時代就有,加上像開源存儲Ceph的出現(xiàn),目前市場中存在著大量海量數(shù)據(jù)存儲產(chǎn)品,可謂是良莠不齊、魚龍混雜。但什么樣的海量數(shù)據(jù)存儲能夠在數(shù)字化和智能化時代中堪當(dāng)大任?我們可以從PowerScale這位海量數(shù)據(jù)之王的發(fā)展中一見端倪。
作為連續(xù)六年位居Gartner分布式存儲領(lǐng)導(dǎo)者象限和排名第一的海量存儲,PoweScale如今已經(jīng)為全球用戶提供超過17EB的存儲容量,在22個行業(yè)中擁有大量頭部客戶,無論是功能性、擴展性、效率性和安全性都是業(yè)界翹楚,一直引領(lǐng)著海量數(shù)據(jù)存儲的發(fā)展。
首先,PowerScale在產(chǎn)品形態(tài)上更加貼近用戶需求,在卓越的橫向擴展系統(tǒng)OneFS的基礎(chǔ)上,從全閃存節(jié)點、混合節(jié)點到歸檔節(jié)點多種型號,可以滿足海量數(shù)據(jù)存儲各種應(yīng)用和工作負載的數(shù)據(jù)存儲需求,幫助用戶充分釋放數(shù)據(jù)紅利。
“PowerScale具有高彈性和可擴展性,可以從最小11TB擴展到100PB,擁有豐富的數(shù)據(jù)協(xié)議接口,對接跨核心、邊緣和云的數(shù)據(jù)源,并且兼容現(xiàn)有Isilon/PowerScale集群,面對任何工作負載都是易用、好用和經(jīng)用?!眲⒅竞楸硎镜?。
其次,PowerScale產(chǎn)品設(shè)計上引領(lǐng)著海量數(shù)據(jù)存儲的需求趨勢。在橫向擴展、安全防護等已有優(yōu)勢的基礎(chǔ)上,近年來PowerScale還帶來了全閃設(shè)計、軟件定義等產(chǎn)品新趨勢。
以全閃為例,如今醫(yī)院的PACS系統(tǒng)當(dāng)前疫情形勢下,需要對接多臺超高速、高精度的醫(yī)療設(shè)備的連續(xù)并行寫入,像CT成像技術(shù),320排探測器、動態(tài)640層帶來了比以往大得多的數(shù)據(jù)量,對于性能要求極高。此外像芯片設(shè)計、自動駕駛等業(yè)務(wù)場景,PB級的數(shù)據(jù)都需要高性能處理,而PowerScale的全閃化設(shè)計無疑很好地滿足各種場景的性能需求趨勢。
“現(xiàn)在醫(yī)療影像領(lǐng)域已經(jīng)開始融入越來越多的AI技術(shù),相關(guān)研究已經(jīng)離不開全閃存的高性能。”劉志洪補充道。
又如閃存、處理器、GPU等硬件的快速發(fā)展,讓軟件定義成為海量數(shù)據(jù)存儲重要的產(chǎn)品趨勢。利用軟件定義的方式,不僅可以充分利用硬件高速發(fā)展的能力,讓整個海量數(shù)據(jù)存儲可以更加快速、靈活和高效產(chǎn)品迭代,并且讓性能、經(jīng)濟性等方面得到充分利用。
第三,PowerScale一直引領(lǐng)著海量數(shù)據(jù)存儲的技術(shù)發(fā)展方向。以大數(shù)據(jù)支持為例,第一代Hadoop大數(shù)據(jù)平臺隨著應(yīng)用和規(guī)模的不斷提升,其存算緊耦合的模式瓶頸日益突出,戴爾在2014年就首先在業(yè)界利用OneFS作為底層文件系統(tǒng),實現(xiàn)了Hadoop計算集群的存算分離;又如,PowerScale率先支持湖倉融合,支持數(shù)據(jù)湖、數(shù)據(jù)倉庫同時訪問,成為越來越多用戶在構(gòu)建湖倉一體架構(gòu)的首選。
“PowerScale二十年來一直都是業(yè)界領(lǐng)先的海量數(shù)據(jù)存儲平臺。如今,PowerScale已經(jīng)沉淀出存管融合、打破邊界、高效低碳、精智平臺、全面防護的五大能力,幫助用戶在核心、邊緣和云端各種環(huán)境滿足不同業(yè)務(wù)應(yīng)用的復(fù)雜數(shù)據(jù)需求,真正打破了數(shù)據(jù)壁壘,幫助用戶數(shù)字化轉(zhuǎn)型中發(fā)掘數(shù)據(jù)價值,提升業(yè)務(wù)智能化程度,在瞬息萬變的市場中保持領(lǐng)先?!眲⒅竞榭偨Y(jié)道。
五大能力深入行業(yè)場景
經(jīng)歷二十余年的不斷創(chuàng)新與打磨,PowerScale五大能力如今在醫(yī)療、生命科學(xué)、ADAS自動駕駛、EDA芯片設(shè)計制造等行業(yè)場景中得到了充分體現(xiàn)。
劉志洪介紹,戴爾成立了一個名為10PB俱樂部,近年來有越來越多不同行業(yè)的用戶進入到俱樂部,“像能源、醫(yī)療、芯片制造等行業(yè)的用戶均已經(jīng)進入到該俱樂部。未來,我們希望成立100PB俱樂部。”
以芯片設(shè)計與制造為例,近年來芯片制程技術(shù)的不斷突破和逼近物理極限,使得芯片設(shè)計和芯片制造兩大場景會產(chǎn)生巨大的數(shù)據(jù)量。具體來看,芯片設(shè)計前期會產(chǎn)生大量小文件數(shù)據(jù),規(guī)模通常是千萬級,每個文件大小則是KB級,對于數(shù)據(jù)存儲的隨機IOPS性能要求極高;而進入到仿真驗證階段,則會產(chǎn)生大量的大文件系統(tǒng),對于存儲的吞吐和帶寬能力要求極高;此外,芯片生產(chǎn)之后,還需要將設(shè)計數(shù)據(jù)、歷史數(shù)據(jù)進行永久存儲和歸檔,用于后續(xù)的新芯片設(shè)計或者質(zhì)量回溯。
戴爾大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲事業(yè)部高級系統(tǒng)工程師高中耀談道:“10納米芯片從頭到尾會產(chǎn)生大約600TB的數(shù)據(jù)規(guī)模,如果升級到7納米,數(shù)據(jù)量就會達到PB級別,而現(xiàn)在的5納米、3納米則對于數(shù)據(jù)存儲的容量和性能有著更大的挑戰(zhàn)?!?/p>
據(jù)悉,當(dāng)前全球Top 20的芯片企業(yè)中,已經(jīng)有80%采用了PowerScale。PowerScale的大規(guī)模橫向擴展能力,以及全閃、混閃、歸檔系列產(chǎn)品可以幫助用戶在芯片設(shè)計制造不同階段靈活使用?!癙owerScale可以讓用戶根據(jù)業(yè)務(wù)需求在性能、容量上進行靈活組合,并且形成單一的文件系統(tǒng),更新?lián)Q代無需遷移數(shù)據(jù),前端用戶使用則是完全透明?!备咧幸a充道。
又如當(dāng)前火爆的人工智能和機器學(xué)習(xí)應(yīng)用,往往需要大量的數(shù)據(jù)采集,在這基礎(chǔ)之上進行模型的訓(xùn)練和反復(fù)迭代,本質(zhì)上是一個數(shù)據(jù)分析型的工作流,涉及到數(shù)據(jù)采集、清洗和訓(xùn)練三個典型的環(huán)境,每個環(huán)節(jié)均會誕生大量的數(shù)據(jù)。
Dell PowerScale幫助用戶構(gòu)建企業(yè)級的數(shù)據(jù)湖,輕松應(yīng)對AI各個環(huán)境產(chǎn)生的海量數(shù)據(jù);高性能的分布式全閃存型號則在性能層面滿足AI的數(shù)據(jù)處理需求;PowerScale對數(shù)據(jù)湖式的多協(xié)議支持,也讓其可以實現(xiàn)一套存儲滿足整個AI訓(xùn)練各個環(huán)節(jié)的數(shù)據(jù)處理需求;PowerScale全面的數(shù)據(jù)安全機制則為AI訓(xùn)練帶來保障。
高中耀表示:“很多用戶在構(gòu)建人工智能應(yīng)用時,往往注重于GPU等算力的投入,卻忽視了數(shù)據(jù)存儲方面的瓶頸,造成了GPU等待或者GPU現(xiàn)象普遍存在,而PowerScale則很好地解決了AI應(yīng)用的數(shù)據(jù)挑戰(zhàn),真正幫助用戶消除GPU等待的現(xiàn)象。”
當(dāng)前,除了芯片設(shè)計與制造、人工智能應(yīng)用外,PowerScale已經(jīng)在媒體娛樂、醫(yī)療健康、生命科學(xué)、金融服務(wù)、智能制造、物聯(lián)網(wǎng)等領(lǐng)域獲得了大量應(yīng)用。劉志洪表示:“PowerScale一直是業(yè)界領(lǐng)先的海量數(shù)據(jù)存儲平臺,并且與Google Cloud、微軟Azure、Cloudera等各種生態(tài)伙伴深度合作,形成存管一體的數(shù)據(jù)湖大生態(tài),真正為用戶的數(shù)字化轉(zhuǎn)型構(gòu)建起堅實的基礎(chǔ)?!?/p>
總體來看,隨著企業(yè)數(shù)字化和智能化轉(zhuǎn)型的深入,海量數(shù)據(jù)激增將會成為新常態(tài),基于海量非結(jié)構(gòu)化數(shù)據(jù)的業(yè)務(wù)正在加速成為核心業(yè)務(wù),支撐這些業(yè)務(wù)的海量數(shù)據(jù)存儲正在成為企業(yè)生產(chǎn)、運營和創(chuàng)新中的不可或缺的基石,而Dell PowerScale無論是技術(shù)、產(chǎn)品,還是行業(yè)方案、生態(tài),都是當(dāng)今海量數(shù)據(jù)存儲的翹楚,未來也將迎來更加廣闊的施展空間。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。