智算時代需要什么樣的存儲?

當華為、滴滴、小鵬等一眾公司近期都紛紛曬出自動駕駛汽車在復(fù)雜路況的行駛情況時,一個觸手可及的智慧時代真的是在加速到來。

在今年的浪潮數(shù)據(jù)中心合作伙伴大會(IPF)2021上,浪潮認為在一個智慧時代里,智慧應(yīng)用無處不在,也帶來了指數(shù)級的計算需求,計算產(chǎn)業(yè)正加速進行到智算時代,同時也面臨著多元化、巨量化和生態(tài)化的挑戰(zhàn)。

事實上,伴隨著計算走向異構(gòu)化、復(fù)雜化,AI模型走向巨量化,在存儲層面同樣會面臨著海量數(shù)據(jù)的誕生、存儲、管理和應(yīng)用等一系列挑戰(zhàn)與問題。正如西部數(shù)據(jù)公司副總裁兼中國區(qū)業(yè)務(wù)總經(jīng)理劉鋼在IPF 2021大會上所言:“高速發(fā)展的人工智能在對數(shù)字經(jīng)濟產(chǎn)生巨大賦能和推動的同時,也推動整個計算產(chǎn)業(yè)往'智慧計算'方向演進,巨量模型和海量數(shù)據(jù),對算力和存儲的需求呈指數(shù)級增長,也將推動著存儲架構(gòu)走向創(chuàng)新?!?/p>

AI摩爾定律背后的一筆數(shù)據(jù)賬

過去,應(yīng)用和場景通常是圍繞著業(yè)務(wù)流程展開;如今,幾乎所有的智慧應(yīng)用都是通過數(shù)據(jù)和算法來驅(qū)動。

數(shù)據(jù)正在成為智算時代最核心的生產(chǎn)要素。隨著《十四五規(guī)劃報告》的頒布,在政策層面上推動數(shù)字時代到來、激活數(shù)據(jù)要素潛能,加快建設(shè)數(shù)字經(jīng)濟、產(chǎn)業(yè)數(shù)字化等,為數(shù)字化的智慧應(yīng)用場景掃除了最后的障礙。

在一個智慧應(yīng)用井噴的時代里,解決算力需求首當其沖,但亦不能忽視背后海量數(shù)據(jù)帶來的挑戰(zhàn)。以往,計算機處理器性能通常是遵循摩爾定律,每兩年左右時間增長一倍。如今隨著人工智能應(yīng)用在多個行業(yè)遍地開花,模型愈發(fā)復(fù)雜,AI在訓練和推理對于算力的需求更加渴望。根據(jù)一些機構(gòu)統(tǒng)計,AI訓練所需要的算力每3.43個月就翻一倍,AI摩爾定律揭示著一個對于算力極度渴求的時代到來。

以O(shè)penAI的GPT模型為例,GPT-1模型參數(shù)只有1.1億個,預(yù)訓練數(shù)據(jù)量為5GB,最大層數(shù)為12層,到了GPT-2,模型參數(shù)增加到15億個,預(yù)訓練數(shù)據(jù)量達到40GB,最大層數(shù)突破到48層;而去年五月發(fā)布的GPT-3,模型參數(shù)則高達1750億個,,預(yù)訓練數(shù)據(jù)量高達45TB,最大層數(shù)高達96層。無論是模型規(guī)模、數(shù)據(jù)量、訓練層數(shù)都是指數(shù)級增加。

西部數(shù)據(jù)公司副總裁兼中國區(qū)業(yè)務(wù)總經(jīng)理劉鋼

僅僅一個模型在短短幾年內(nèi)就發(fā)生了驚人的演進,隨著大量AI模型在行業(yè)中得到應(yīng)用,隨之而來的海量數(shù)據(jù)可想而知??梢灶A(yù)見,在未來的智算時代中,海量數(shù)據(jù)的處理、存儲、流動與管理將面臨著極為嚴峻的挑戰(zhàn)。

以自動駕駛為例,一輛L4級的自動駕駛車輛,每天就能夠誕生高達60TB的數(shù)據(jù),根據(jù)法規(guī)需求,這些數(shù)據(jù)還要保存至少30年以上,自動駕駛公司每天還需要不斷訓練新數(shù)據(jù),以實現(xiàn)模型的優(yōu)化。光自動駕駛這一個場景的數(shù)據(jù)存儲、應(yīng)用、流動和歸檔就充滿了挑戰(zhàn)。

“面對人工智能應(yīng)用帶來的挑戰(zhàn),一定不能只用一種技術(shù)來解決,而是需要在存儲架構(gòu)層進行創(chuàng)新。”劉鋼直言道。

存儲架構(gòu)必然走向變革

歸根結(jié)底,數(shù)字經(jīng)濟的快速發(fā)展,讓智慧應(yīng)用在數(shù)據(jù)類型、數(shù)據(jù)量、數(shù)據(jù)處理等方面的需求比以往有了指數(shù)級的提升。如何讓這些海量數(shù)據(jù)能夠存得下、用得快、流得動和管得好,是當下存儲架構(gòu)最具挑戰(zhàn)的難題。

為此,西部數(shù)據(jù)開出了它的“組合藥方”:去中心化分布式存儲、分層存儲和分區(qū)存儲三大創(chuàng)新存儲架構(gòu)。

首先,去中心化分布式存儲解決的是讓更多數(shù)據(jù)存下來的難題。眾所周知,隨著區(qū)塊鏈、人工智能等技術(shù)逐漸在業(yè)務(wù)場景中走向融合,基于這些技術(shù)的智慧應(yīng)用正在數(shù)字版權(quán)、供應(yīng)鏈管理、醫(yī)療健康等多個行業(yè)誕生,隨之而來的就是海量數(shù)據(jù),而去中心化分布式存儲將大幅降低存儲成本,存儲更多數(shù)據(jù)。

其次,分層存儲解決的是讓存儲資源可以物盡其用,充分滿足數(shù)據(jù)生命周期不同階段對于存儲資源的需求。劉鋼透露,西部數(shù)據(jù)根據(jù)數(shù)據(jù)對存儲時延、容量的需求,將分層存儲架構(gòu)劃分為五層:極熱存儲、熱存儲、溫存儲、冷存儲和極冷存儲,并且每一層都有對應(yīng)產(chǎn)品來保障。

比如像一些內(nèi)存計算、數(shù)據(jù)分析類的場景,對于數(shù)據(jù)處理性能極度渴望,就更加適合采用極熱存儲;而自動駕駛等AI場景,對于數(shù)據(jù)處理性能、容量都有著很高的要求,采用熱存儲就非常符合?!皩τ跇O熱存儲和熱存儲、溫存儲,西部數(shù)據(jù)都有著高性能SSD、主流SSD等不同方案來滿足需求?!眲摻榻B道。

眾所周知,在智慧應(yīng)用遍地開花的今天,閃存的容量、性能和成本正變得至關(guān)重要。尤其是當前SSD容量點正在從4TB升級到8TB的關(guān)鍵時期,對于閃存廠商的產(chǎn)品、技術(shù)、產(chǎn)能是一場大考。劉鋼直言:“如今,大規(guī)模產(chǎn)能對于SSD很關(guān)鍵,西部數(shù)據(jù)和鎧俠戰(zhàn)友全球三分之一的份額,可以在產(chǎn)能層面提供充足的保障。”

此外,西部數(shù)據(jù)在閃存上的技術(shù)也讓其在智慧應(yīng)用中游刃有余,“西部數(shù)據(jù)在2月已經(jīng)發(fā)布了第六代162層3D NAND技術(shù),橫向單元陣列密度比上一代提升了10%,晶圓尺寸減少40%,IO性能提升66%,可以滿足不斷增長的數(shù)據(jù)處理性能需求?!眲撗a充道:“在充足產(chǎn)能和領(lǐng)先技術(shù)的基礎(chǔ)上,西部數(shù)據(jù)還在控制器、高性能固件等縱向集成上進行優(yōu)化,確保閃存在容量、性能、成本、功耗上實現(xiàn)最優(yōu)。”

第三個創(chuàng)新存儲架構(gòu)則是分區(qū)存儲,它致力于解決性能、規(guī)模、成本等問題,不再需要去過將近28%的榮譽空間,性能和QoS大幅提升,最大程度提升了存儲規(guī)模和利用率,并且有效降低存儲的TCO。

更加重要的是,西部數(shù)據(jù)的創(chuàng)新存儲架構(gòu)已經(jīng)在云服務(wù)、生物醫(yī)藥、區(qū)塊鏈等多個業(yè)務(wù)場景中得到了充分實踐與考驗。

西部數(shù)據(jù)與浪潮:智算時代合作典范

面對智算時代多元化、巨量化和生態(tài)離散化的挑戰(zhàn),不是一家公司所能應(yīng)對的。為此,浪潮在本次IPF大會上提出了元腦生態(tài)2.0計劃,打造智算時代開放包容生態(tài)體系,以吸納更多合作伙伴到智算產(chǎn)業(yè)大生態(tài)之中。

事實上,西部數(shù)據(jù)與浪潮堪稱成功合作的典范,針對智慧業(yè)務(wù)場景,雙方緊密配合,攜手打造解決方案。例如,西部數(shù)據(jù)與浪潮推出聯(lián)合解決方案,可以提供極致的存儲容量,同時降低集群的節(jié)點數(shù)量,與傳統(tǒng)方案相比,大幅降低功耗和機柜空間成本。

又如,浪潮存儲在元腦生態(tài)2.0基礎(chǔ)上推出了“元腦新存儲生態(tài)”,聯(lián)合各類合作伙伴構(gòu)建“以用戶為中心、以應(yīng)用為導(dǎo)向”的場景共同體,強調(diào)存儲系統(tǒng)針對智慧應(yīng)用將走向場景化、細分化、個性化,這恰恰與西部數(shù)據(jù)所強調(diào)針對業(yè)務(wù)數(shù)據(jù)特性采用不同技術(shù)的觀點高度契合。未來,西部數(shù)據(jù)與浪潮存儲在元腦新存儲生態(tài)建設(shè)上同樣有著巨大的合作空間。

劉鋼在最后也表示:“西部數(shù)據(jù)與浪潮結(jié)合雙方前沿科技與產(chǎn)品的獨特優(yōu)勢,協(xié)力打造出高性能、低成本、且兼具穩(wěn)定性與擴展性等特點的卓越解決方案,優(yōu)化資源配置,賦能智慧計算。未來,雙方將繼續(xù)加強縱深合作,不斷以創(chuàng)新的數(shù)據(jù)存儲架構(gòu)和解決方案,應(yīng)對市場多樣化的需求,并攜手生態(tài)系統(tǒng)中的各方伙伴共同推動智能產(chǎn)業(yè)的轉(zhuǎn)型與發(fā)展,為行業(yè)用戶創(chuàng)造更多價值?!?/p>

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-04-23
智算時代需要什么樣的存儲?
正如西部數(shù)據(jù)公司副總裁兼中國區(qū)業(yè)務(wù)總經(jīng)理劉鋼在IPF2021大會上所言:“高速發(fā)展的人工智能在對數(shù)字經(jīng)濟產(chǎn)生巨大賦能和推動的同時,也推動整個計算產(chǎn)業(yè)往'智慧計算'方向演進,巨量模型和海量數(shù)據(jù),對算力

長按掃碼 閱讀全文