原標題:跨越數(shù)據(jù)的“嘆息墻”:華為下一代數(shù)據(jù)湖與HPDA時代
公元前586年,耶路撒冷的第一圣殿被入侵的巴比倫軍隊摧毀,所羅門王朝的恢弘建筑只留下一座“嘆息之墻”。從此開始,“嘆息墻”經(jīng)常被比喻為那些時代難以跨越的鴻溝。在大數(shù)據(jù)與智能時代,千行百業(yè)擁有了前所未有的數(shù)據(jù)種類、數(shù)據(jù)存量和數(shù)據(jù)應用方式,但這些海量的數(shù)據(jù)也同時造成了嚴苛的挑戰(zhàn),給很多行業(yè)、企業(yè)塑造了一道由數(shù)據(jù)組成的“嘆息墻”。
想要以超高的算力、多元化的智能算法攻克產(chǎn)業(yè)難題,拓展價值邊界,首先需要跨越數(shù)據(jù)鴻溝,將龐大的數(shù)據(jù)由負擔轉(zhuǎn)化為助力。
尤其對于HPC(高性能計算)場景來說,豐富的數(shù)據(jù)正在帶給計算體系以深刻的價值變革,推動HPC的任務目標、任務實現(xiàn)方式與應用承載方式產(chǎn)生一系列升級。HPC正在走向HPDA(高性能數(shù)據(jù)分析)的躍遷之路。
3月23日,華為宣布創(chuàng)新數(shù)據(jù)基礎設施體驗中心及行業(yè)創(chuàng)新體驗中心在成都落成,該體驗中心旨在搭建一個面向全球政府、金融、醫(yī)療、教育、能源等行業(yè)的技術交流與合作平臺。在參觀創(chuàng)新數(shù)據(jù)基礎設施體驗中心的過程中,華為推出的下一代數(shù)據(jù)湖解決方案OceanStor Pacific讓我產(chǎn)生了不小的興趣。
讓我們從數(shù)據(jù)與計算的新發(fā)展周期說起,聊聊華為OceanStor Pacific給產(chǎn)業(yè)探索帶來的新可能。
不能讓數(shù)據(jù)成為“嘆息墻”:HDPA為何是大勢所趨?
以往的HPC場景,或者我們在廣泛定義中的超算系統(tǒng),雖然也要有存儲系統(tǒng)作為支撐,但其主要解決的是數(shù)值分析、模型分析等靠近數(shù)學側(cè)的問題。HPC的目標相對單一,其價值主要是作為底層科研工具支撐社會的發(fā)展。
但隨著技術的進步和產(chǎn)業(yè)需求的發(fā)展,超級算力正在與越來越多的現(xiàn)實產(chǎn)業(yè)與科技探索相結(jié)合。而這就引出了一個關鍵的問題:HPC系統(tǒng)需要應對、存儲、調(diào)用非常復雜的現(xiàn)實數(shù)據(jù)。
在今年,新冠疫苗成為了社會關注度最高的話題之一,而疫苗研發(fā)的背后就有HPC對蛋白質(zhì)分析、病毒模型解析等海量數(shù)據(jù)的處理能力。這場全球抗疫的關鍵賽跑,同時也蘊含著算力與數(shù)據(jù)間的一場競賽。
HPC與真實產(chǎn)業(yè)、現(xiàn)實場景結(jié)合的案例正在不斷激增,自動駕駛、油氣勘探、精準天氣預報、天文觀察等等場景,既需要強大的算力,同時也需要計算系統(tǒng)負載和處理差異化明顯的不同數(shù)據(jù)。比如自動駕駛需求處理大量視頻與傳感數(shù)據(jù)、交通安全需要處理海量圖片數(shù)據(jù),而這些數(shù)據(jù)帶來的壓力,構成了超算體系進入智能時代的主要挑戰(zhàn)和進化方向。隨著計算能力本身的提升,加上大數(shù)據(jù)、AI等新興技術與傳統(tǒng)HPC的結(jié)合,超算系統(tǒng)走向數(shù)據(jù)密集型、多元化處理能力已經(jīng)成為了確定性需求,這也就是從HPC到HDPA的演變必然性。
而想要確保這場演變順利完成,我們可以發(fā)現(xiàn)超算系統(tǒng)需要克服三大挑戰(zhàn):
1、首先是數(shù)據(jù)量的持續(xù)指數(shù)級增長。
以油氣勘探生成3D模型為例,模型的精準化將帶來十倍的數(shù)據(jù)膨脹;而一輛自動駕駛汽車測試,每天就將產(chǎn)生60TB的必須長期保存數(shù)據(jù)。應對真正的海量數(shù)據(jù),成為了HDPA時代的第一課。
2、數(shù)據(jù)負載類型多元化。
與傳統(tǒng)的數(shù)據(jù)存放類型相比,新周期的數(shù)據(jù)負載將出現(xiàn)數(shù)據(jù)多樣化統(tǒng)一存放、處理的巨大變革。并且在數(shù)據(jù)混合負載的基礎上,還需要支撐更頻繁、便捷的數(shù)據(jù)調(diào)用、數(shù)據(jù)遷移等操作,給數(shù)據(jù)體系帶來了眾多全新壓力。
3、數(shù)據(jù)相關應用復雜化。
目前階段,AI技術正在成為算力投放的主要標的,數(shù)據(jù)應用的主要輸出點。但AI算法本身復雜多元,個性化極強。這意味著智能時代的超算相關應用將極大復雜化,帶給數(shù)據(jù)存儲以額外的挑戰(zhàn)。
這些挑戰(zhàn)意味著,數(shù)字經(jīng)濟時代HPC正在由計算密集型走向存儲密集型。與此同時可以看到,HPC已經(jīng)成為大國科技競賽中的重要賽道。在HPC體系中,數(shù)據(jù)基礎設施又處在發(fā)展相對緩慢的一環(huán)。2020年開始,超算中心已經(jīng)成為“新基建”規(guī)劃中的主要建設方向,而新基建中的超算中心,顯然應該是能夠承載多樣化數(shù)據(jù)、海量數(shù)據(jù)規(guī)模,與國計民生緊密相聯(lián)的計算體系。而這就需要能夠支撐HPDA演變的數(shù)據(jù)基礎設施升級。
為此,華為推出了OceanStor Pacific系列下一代數(shù)據(jù)湖存儲,推動HPC向HPDA加速演進。
下一代數(shù)據(jù)湖:華為海量存儲OceanStor Pacific帶來的變革
從HPC向HPDA演進,首當其中是要提升各產(chǎn)業(yè)數(shù)據(jù)中心、超算系統(tǒng)的數(shù)據(jù)存儲、負載、調(diào)用能力,而這就需要數(shù)據(jù)湖相關產(chǎn)品完成能力上的進化升級。
2011年,業(yè)界開始出現(xiàn)數(shù)據(jù)湖相關概念,所謂數(shù)據(jù)湖,是指對自然、原始格式數(shù)據(jù)進行全量存儲的數(shù)據(jù)基礎設施。數(shù)據(jù)湖可以承載原始數(shù)據(jù)直接存放的容量挑戰(zhàn),同時支持AI、可視化、大數(shù)據(jù)分析等關鍵應用的演進。
作為HPC的數(shù)據(jù)搭檔,數(shù)據(jù)湖需要在HPDA演進中扮演關鍵角色。在目前階段,新車的研發(fā)時間由6年縮短為2年,基因測序時長由13年縮短為僅僅1天,油氣勘探的精度由二維提升到三維,這背后都需要數(shù)據(jù)湖完成數(shù)據(jù)存放、調(diào)用的支撐。
在華為看來,數(shù)據(jù)湖的升級演進主要需要完成三大目標:
1、超高密設計:數(shù)據(jù)基礎設施的升級,不能以無限制投入空間和投資為代價,所以數(shù)據(jù)湖產(chǎn)品的高密設計是必由之路。存儲產(chǎn)品需要在有限的空間下,完成海量數(shù)據(jù)的有效存放。
2、面向混合負載:面向產(chǎn)業(yè)級的超算體系,一套存儲必須支持支持不同業(yè)務流程、產(chǎn)業(yè)環(huán)節(jié)的混合負載。以油氣勘探為例,過往數(shù)據(jù)采集、解釋、處理每個環(huán)節(jié)的業(yè)務能力對存儲的需求都不同,只能搭建多套存儲來應付,而這會造成大量遷移成本和風險。數(shù)據(jù)湖產(chǎn)品必須實現(xiàn)多數(shù)據(jù)、多業(yè)務的混合負載,完成對產(chǎn)業(yè)級超算的支撐。
3、多協(xié)議快速流轉(zhuǎn):面向產(chǎn)業(yè)超算需求,存儲體系需要能夠支撐不同數(shù)據(jù)類型的打通,支持多種數(shù)據(jù)種類、模塊之間的快速流轉(zhuǎn)。
面對這些趨勢,華為已經(jīng)推出了全?;南乱淮鷶?shù)據(jù)湖解決方案。去年年底,華為正式推出了海量存儲OceanStor Pacific,能夠滿足HPC向HPDA的演進需求。OceanStor Pacific支持4096個節(jié)點,能夠支持混合負載、融合協(xié)議互通,可以說是為高性能計算、大數(shù)據(jù)乃至視頻存儲構建的新一代的數(shù)據(jù)湖存儲。
OceanStor Pacific分為兩款硬件。一款是被華為戲稱為“超級跑車”的OceanStor Pacific 9950,其高密設計可以有效解決海量數(shù)據(jù)的機房空間、能源消耗問題。高密高性能全閃存硬件,可以實現(xiàn)5U空間支持80個Half Palm盤,每U IOPS領先業(yè)界60%,每U帶寬領先業(yè)界30%。而高密大容量硬件OceanStor Pacific 9550,則被稱為“容量怪獸”,5U空間可以放置120塊大容量HDD盤,實現(xiàn)“1臺頂三臺”的容量提升。與此同時,OceanStor Pacific還在高密空間、便捷維護、散熱性能等設計上獨樹一幟,實現(xiàn)下一代數(shù)據(jù)湖價值的全面釋放。
HDPA時代,我們將見證的數(shù)據(jù)聚變
從華為OceanStor Pacific帶來的數(shù)據(jù)湖升級價值,我們已經(jīng)可以看到海量存儲升級為HPDA時代帶來的價值演進。在數(shù)據(jù)基礎設施的升級下,超算體系可以更緊密與物理世界的海量數(shù)據(jù)融合,帶來超算能力參與到產(chǎn)業(yè)一線、科研前沿的全新可能。同時,智能化技術也可以在海量數(shù)據(jù)存儲的升級下得到更好支撐,我們知道數(shù)據(jù)、算法和算力是智能三要素,而數(shù)據(jù)的便捷、可靠、大容量,是產(chǎn)業(yè)級智能升級的開始。
HPDA時代,超算能力將從算力密集型的數(shù)學、機械等領域,向數(shù)據(jù)密集型的天文、物理、化學、地質(zhì),以及千行百業(yè)的生產(chǎn)力一線進發(fā)。而我們已經(jīng)可以看到華為OceanStor Pacific在很多案例中帶來了這種價值改變。
比如在全球著名的SKA天文望遠鏡陣列中,上海天文臺就與華為合作,搭建了世界首臺SKA區(qū)域中心原型機核心業(yè)務存儲系統(tǒng)。在存儲能力升級的前提下,探索宇宙身處奧秘的SKA得到了更強的數(shù)據(jù)處理效率,加速了人類打開未知世界大門。
在挪威Lundin石油的深海油氣勘業(yè)務中,華為幫助其建設了匹配新型油藏模擬技術的存儲基礎架構,實現(xiàn)數(shù)據(jù)高效存儲、分析,并且能夠有效提升勘探精度,大幅度油氣勘探效率。在華為OceanStor 海量存儲的幫助下,挪威Lundin石油實現(xiàn)了冷數(shù)據(jù)分層存儲,存儲空間節(jié)省了73%,遠程復制容災效率極大提升。
這些案例僅僅是HPDA時代的開端,我們已經(jīng)可以看到,在自動駕駛、基因測序、電影渲染、精準天氣預報、金融反欺詐等領域,海量存儲有著廣泛的應用前景,并且是數(shù)據(jù)計算能力提升的必然需求。
在HPDA時代,如山似海的數(shù)據(jù)不再會是產(chǎn)業(yè)發(fā)展的“嘆息墻”,而是行業(yè)智能化的跑道與發(fā)動機。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領先技術與深度整合是關鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。