原標(biāo)題:分布式架構(gòu)馭數(shù)而行,海量數(shù)據(jù)方能有備無患
“過去會(huì)區(qū)分核心數(shù)據(jù)和非核心數(shù)據(jù)?,F(xiàn)在是所有數(shù)據(jù)都很重要,所有數(shù)據(jù)都不能丟失?!比ツ晡錆h一家大型三甲醫(yī)院信息中心主任接受筆者采訪的觀點(diǎn)依然讓人記憶猶新。
無獨(dú)有偶,在產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化的雙輪驅(qū)動(dòng)下,一個(gè)海量數(shù)據(jù)時(shí)代正加速到來。IDC《數(shù)據(jù)時(shí)代2025》白皮書就預(yù)測,到2025年全球數(shù)據(jù)量總和將達(dá)到175ZB;其中,來自中國的數(shù)據(jù)量預(yù)計(jì)未來五年年平均增長30%,并且到2025年將成為全球數(shù)據(jù)量最大的區(qū)域。
海量數(shù)據(jù)時(shí)代來臨,一方面為企業(yè)擁抱數(shù)字化、洞悉市場規(guī)律、挖掘數(shù)據(jù)價(jià)值提供了充分條件;另一方面,海量數(shù)據(jù)的存儲(chǔ)、備份、恢復(fù)等也給傳統(tǒng)備份方式、產(chǎn)品帶來了前所未有的挑戰(zhàn)。正如愛數(shù)公司所認(rèn)為,數(shù)據(jù)大爆炸讓數(shù)據(jù)備不完、存不下、管理難愈發(fā)成為各行各業(yè)的新常態(tài),而基于分布式架構(gòu)的備份系統(tǒng),正是應(yīng)對海量數(shù)據(jù)備份恢復(fù)挑戰(zhàn)的那一副良劑。
為何繞不開一個(gè)“快”字
海量數(shù)據(jù)的產(chǎn)生離不開外部政策的強(qiáng)力導(dǎo)向和企業(yè)數(shù)字化轉(zhuǎn)型的內(nèi)部強(qiáng)大驅(qū)動(dòng)力。
以中國市場為例,《中國數(shù)字經(jīng)濟(jì)發(fā)展白皮書(2020)》透露,數(shù)字經(jīng)濟(jì)近年來成為經(jīng)濟(jì)發(fā)展的又一引擎,其GDP占比逐年提升,在數(shù)字經(jīng)濟(jì)的推動(dòng)下,各行各業(yè)的數(shù)字化轉(zhuǎn)型明顯提速;而剛剛出爐的《十四五規(guī)劃》報(bào)告中,更是強(qiáng)調(diào)提升數(shù)字產(chǎn)業(yè)經(jīng)濟(jì)占比的核心目標(biāo),全面推動(dòng)建設(shè)數(shù)字中國和發(fā)展數(shù)字經(jīng)濟(jì)。
同樣,海量數(shù)據(jù)的產(chǎn)生也離不開企業(yè)數(shù)字化轉(zhuǎn)型強(qiáng)大的內(nèi)部驅(qū)動(dòng)力。尤其是隨著數(shù)字化轉(zhuǎn)型進(jìn)入到深水區(qū),云計(jì)算、大數(shù)據(jù)、AI等數(shù)字化技術(shù)加速在業(yè)務(wù)場景中落地,極大地產(chǎn)生了豐富的數(shù)據(jù)。
那么,與過去相比,如何理解當(dāng)前海量數(shù)據(jù)的規(guī)模?
用幾個(gè)簡單的數(shù)據(jù)來形象說明。例如,一家中型科技公司的開發(fā)測試環(huán)境往往達(dá)到上萬個(gè)虛擬機(jī)主機(jī);交通、智慧城市等場景一年往往能產(chǎn)生超過10PB規(guī)模的數(shù)據(jù)量;銀行、保險(xiǎn)等金融機(jī)構(gòu)擁有超億個(gè)小文件……
各個(gè)行業(yè)用戶明顯感覺到數(shù)據(jù)量爆炸性的增長。“面對海量數(shù)據(jù),越來越多用戶存在備不完、存不下、管理難的情況。”愛數(shù)AnyBackup產(chǎn)品副總裁常華如是說。
具體來看,首先是用戶的數(shù)據(jù)總量呈現(xiàn)出指數(shù)級(jí)的增長趨勢,完全備份幾乎無法完成,哪怕用戶,精打細(xì)算、調(diào)優(yōu)海量備份任務(wù)的計(jì)劃調(diào)度,依然有觸碰到紅線的風(fēng)險(xiǎn);其次,采用傳統(tǒng)備份架構(gòu)體系,往往存在著N套備份系統(tǒng)對應(yīng)N*N個(gè)備份客戶端的情況,使得管理備份任務(wù)變得異常復(fù)雜;最后,隨著數(shù)字化程度越來越高,用戶生產(chǎn)數(shù)據(jù)增速越來越快,但是規(guī)定的備份時(shí)間窗口沒有變,使得備份窗口壓力極大。
“傳統(tǒng)備份解決方案通常是采用串聯(lián)、堆疊的部署方式,現(xiàn)在已經(jīng)很難適用海量數(shù)據(jù)的保護(hù)了。”常華表示道,“解決之道就是分布式架構(gòu),通過分布式架構(gòu)的易擴(kuò)展、高吞吐和高可用,來實(shí)現(xiàn)海量數(shù)據(jù)備份恢復(fù)的以快制勝。”
分布式架構(gòu)有何獨(dú)特之處
在數(shù)據(jù)保護(hù)領(lǐng)域采用分布式架構(gòu)乃是順勢而為,順應(yīng)了海量數(shù)據(jù)時(shí)代數(shù)據(jù)保護(hù)需求的變化。
分布式架構(gòu)本身并不稀奇,之前在IT各個(gè)領(lǐng)域都有著廣泛的應(yīng)用。那么,分布式架構(gòu)應(yīng)用在數(shù)據(jù)保護(hù)領(lǐng)域有哪些獨(dú)特之處,它又是如何實(shí)現(xiàn)易擴(kuò)展、高吞吐和高可用來解決海量數(shù)據(jù)備份恢復(fù)的挑戰(zhàn)?
以愛數(shù)AnyBackup Family 7分布式架構(gòu)為例,之所以能實(shí)現(xiàn)易擴(kuò)展、高吞吐和高可用,不僅僅是其采用了Scale-Out橫向擴(kuò)展架構(gòu),還在于其完成了從客戶端到底層備份介質(zhì)端到端的優(yōu)化,針對備份恢復(fù)的每一個(gè)環(huán)節(jié)進(jìn)行有針對性的優(yōu)化,從局部到整體完成與分布式架構(gòu)的適配、調(diào)優(yōu)。
例如,在客戶端,針對虛擬化、數(shù)據(jù)庫、云平臺(tái)等工作負(fù)載,愛數(shù)提供了專有API,結(jié)合各種調(diào)優(yōu)算法,來實(shí)現(xiàn)海量備份性能的提升;又如,通過負(fù)載均衡,對于備份任務(wù)和備份容量進(jìn)行多任務(wù)分發(fā)和合理分配,以達(dá)到一個(gè)整體最優(yōu)的性能。
“在六節(jié)點(diǎn)集群吞吐量測試報(bào)告中,備份吞吐率達(dá)到36TB/h,恢復(fù)吞吐率達(dá)到20TB/h?!背HA透露,“愛數(shù)AnyBackup Family 7分布式架構(gòu)今年將實(shí)現(xiàn)單套備份系統(tǒng)最高支持32個(gè)節(jié)點(diǎn),存儲(chǔ)池容量超過10PB。”
另外,存算分離架構(gòu)也是愛數(shù)AnyBackup Family 7分布式架構(gòu)的一大核心特征。存算分離架構(gòu)的一大好處就是具有足夠的靈活性,當(dāng)用戶規(guī)模越來越大之后,其對于靈活性要求也會(huì)提升,往往需要根據(jù)業(yè)務(wù)或者工作負(fù)載的需求來靈活擴(kuò)展計(jì)算或者存儲(chǔ),如果采用計(jì)算與存儲(chǔ)緊耦合的方式,計(jì)算與存儲(chǔ)擴(kuò)縮容則極為不方便,無法滿足用戶業(yè)務(wù)對于靈活性的需求。
以愛數(shù)AnyBackup Family 7分布式架構(gòu)為例,在其存算分離架構(gòu)之中,分布式計(jì)算主要負(fù)責(zé)海量任務(wù)并發(fā)和負(fù)載均衡,完成各種任務(wù)的調(diào)度、匹配與優(yōu)化;而分布式存儲(chǔ)則通過多通道的并發(fā)和數(shù)據(jù)負(fù)載均衡,將接受過來的數(shù)據(jù)寫入到備份節(jié)點(diǎn)之中。
“存算分離架構(gòu),可以最大限度來提升備份與恢復(fù)的每個(gè)工作環(huán)節(jié)。”愛數(shù)AnyBackup研發(fā)副總裁鄧平介紹道,“例如,分布式的SLA策略調(diào)度,針對保護(hù)任務(wù)、保護(hù)對象,采取不同的備份策略和周期?!?/p>
事實(shí)上,采用分布式架構(gòu)的備份產(chǎn)品在實(shí)際業(yè)務(wù)場景中已經(jīng)凸顯出其優(yōu)勢。以某省政務(wù)云平臺(tái)為例,其云主機(jī)的數(shù)據(jù)量已經(jīng)達(dá)到1520TB,數(shù)據(jù)庫的數(shù)據(jù)量則達(dá)到了1641TB,整個(gè)平臺(tái)有數(shù)千個(gè)任務(wù),并且依然保持著很高的增長速度,其每個(gè)備份域只需要部署一套備份系統(tǒng)即可完成日常的備份作業(yè),所有39個(gè)節(jié)點(diǎn)通過一套運(yùn)營管理產(chǎn)品就實(shí)現(xiàn)了全平臺(tái)的管理,極大簡化了日常管理工作。
從分布式架構(gòu)帶來哪些啟示
哈佛大學(xué)管理學(xué)教授克里斯坦森在《創(chuàng)新者的窘境》中認(rèn)為,創(chuàng)新關(guān)鍵不僅僅在于技術(shù)進(jìn)步或者科學(xué)發(fā)現(xiàn),更加關(guān)鍵的是在于對市場需求變遷的主動(dòng)響應(yīng)。
毫無疑問,海量數(shù)據(jù)時(shí)代,用戶對于備份恢復(fù)的需求變化就是“快”,在時(shí)間窗口有限的情況下完成對于不斷增長的海量數(shù)據(jù)的備份、管理與恢復(fù)。
這種趨勢直接驅(qū)動(dòng)著以愛數(shù)為代表的公司將分布式架構(gòu)創(chuàng)新應(yīng)用在備份產(chǎn)品之上,并且以全局的視角,以及著眼于備份恢復(fù)每一個(gè)環(huán)節(jié)的優(yōu)化,來實(shí)現(xiàn)“快”這個(gè)目標(biāo)。
面向未來,“快”始終是數(shù)據(jù)備份恢復(fù)的核心目標(biāo),分布式架構(gòu)在數(shù)據(jù)保護(hù)領(lǐng)域的創(chuàng)新還會(huì)有巨大的空間,以真正實(shí)現(xiàn)海量數(shù)據(jù)的有備無患。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。