東京證交所宕機(jī)調(diào)查結(jié)果出爐,數(shù)據(jù)安全警鐘需長(zhǎng)鳴

數(shù)據(jù)安全決定著一家企業(yè)的生死與未來。

這絕對(duì)不是危言聳聽。近幾年來,現(xiàn)實(shí)中慘痛教訓(xùn)不斷上演:天津某醫(yī)院數(shù)據(jù)中心因持續(xù)大雨被淹,由于未做災(zāi)備,導(dǎo)致醫(yī)院無法開展業(yè)務(wù);某云服務(wù)商因?yàn)榈讓哟疟P靜默錯(cuò)誤以及數(shù)據(jù)遷移操作不規(guī)范,導(dǎo)致某用戶平臺(tái)級(jí)數(shù)據(jù)全部丟失,業(yè)務(wù)從此難以為繼;某互聯(lián)網(wǎng)技術(shù)服務(wù)商數(shù)據(jù)被惡意刪除,恢復(fù)耗時(shí)七天七夜,賠償客戶損失1.5億元……

最近一個(gè)鮮活的例子是,東京證券交易所在十一期間因?yàn)榇鎯?chǔ)故障導(dǎo)致業(yè)務(wù)大癱瘓,暫停交易一天,損失和影響不可估量。哪怕貴為全球第三大證券交易所的東京證券交易所,其IT建設(shè)經(jīng)驗(yàn)如此豐富、IT基礎(chǔ)設(shè)施如此強(qiáng)大的情況下,當(dāng)故障發(fā)生時(shí),依然無法從容應(yīng)對(duì)。此刻,不談災(zāi)備,何來以后的數(shù)據(jù)安全。

正所謂“后人哀之而不鑒之,亦使后人復(fù)哀后人也!”這一切不禁讓人思考:過去的災(zāi)備建設(shè)體系是否真的適合如今快速變化的數(shù)字化時(shí)代?未來容災(zāi)的趨勢(shì)又會(huì)朝著哪些方向發(fā)展?

東京證券交易所事件引發(fā)的思考

今年十月一號(hào),東京證券交易所因?yàn)榇鎯?chǔ)設(shè)備故障導(dǎo)致暫停交易一天。當(dāng)時(shí)筆者就猜測(cè),此次事故可能并不是簡(jiǎn)單的設(shè)備故障而引起的。

果不其然,東京證券交易所宕機(jī)事故處理結(jié)果近日出爐。日本金融服務(wù)管理局(FSA)調(diào)查顯示,故障的根本原因是“故障設(shè)備出現(xiàn)了缺陷”;但由于“為故障設(shè)備制定的故障自動(dòng)切換機(jī)制不夠到位,加上TSE沒有為交易恢復(fù)制定合適的規(guī)定”,最終導(dǎo)致了十月一號(hào)的混亂局面。

東京證券交易所經(jīng)歷大宕機(jī)

調(diào)查報(bào)告指出,當(dāng)故障發(fā)生時(shí),備用設(shè)備并沒有自動(dòng)接管,之后只能通過人工方式,手動(dòng)切換到備用設(shè)備。該報(bào)告甚至還發(fā)現(xiàn),該交易所并沒有制定恢復(fù)交易的程序,以防發(fā)生此類故障,而且缺乏明確的規(guī)定。

任何事件都不能孤立地去看待,如果脫離其所處的時(shí)代背景去分析則缺乏真正的借鑒意義。正如東京證券交易所宕機(jī)事件中,我們不能簡(jiǎn)單將此次故障歸咎于富士通存儲(chǔ)設(shè)備的問題,因?yàn)橛布收铣霈F(xiàn)無可厚非,任何硬件都達(dá)不到100%的絕對(duì)安全可靠;我們亦不能簡(jiǎn)單怪罪于恢復(fù)機(jī)制的缺陷,因?yàn)檫^去制定的規(guī)則與規(guī)范,隨著歲月的推移,無法適應(yīng)新時(shí)代的變化。

我們需要真正深刻思考的是:在數(shù)字化浪潮滾滾而來的時(shí)代下,數(shù)據(jù)爆炸性增長(zhǎng)、數(shù)據(jù)價(jià)值加速凸顯、數(shù)據(jù)使能日趨迫切,保障業(yè)務(wù)連續(xù)性已成頭等大事,災(zāi)備建設(shè)的重要性是否引起大家足夠的重視、災(zāi)備架構(gòu)設(shè)計(jì)是否符合未來業(yè)務(wù)發(fā)展的需求、災(zāi)備一系列流程規(guī)范是否真正具有可執(zhí)行性?

你是否真的了解數(shù)據(jù)災(zāi)備需求

“過去會(huì)區(qū)分核心數(shù)據(jù)和非核心數(shù)據(jù)?,F(xiàn)在是所有數(shù)據(jù)都重要,所有數(shù)據(jù)都不能丟失。”一家三甲醫(yī)院信息中心主任今年接受大數(shù)據(jù)在線采訪時(shí)如是說。

這恰恰反映出數(shù)據(jù)的重要性今非昔比。數(shù)據(jù)正在成為最重要的生產(chǎn)要素之一,更是一切應(yīng)用運(yùn)轉(zhuǎn)的基礎(chǔ)。然而,數(shù)據(jù)保護(hù)的難度也不可同日而語。這些年,隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的不斷應(yīng)用,直接驅(qū)動(dòng)著新應(yīng)用不斷涌現(xiàn),應(yīng)用類型不僅走向復(fù)雜化和多元化,也帶動(dòng)了數(shù)據(jù)類型走向多元化,給災(zāi)備建設(shè)帶來了前所未有的挑戰(zhàn)。

以銀行為例,2019年銀行業(yè)共處理電子支付業(yè)務(wù)2233億筆,業(yè)務(wù)規(guī)模是2009年的40倍,小額、高頻支付場(chǎng)景正在迅速成為常態(tài),使得銀行的交易、清算等業(yè)務(wù)帶來了前所未有的交易頻次、數(shù)據(jù)規(guī)模以及對(duì)業(yè)務(wù)連續(xù)性的強(qiáng)需求。

“數(shù)字化轉(zhuǎn)型加速了企業(yè)業(yè)務(wù)走向線上化和數(shù)字化,對(duì)業(yè)務(wù)連續(xù)性要求變得極高?!比A為存儲(chǔ)技術(shù)專家告訴大數(shù)據(jù)在線。事實(shí)上的確如此,面對(duì)如此豐富的應(yīng)用以及所產(chǎn)生的海量多元數(shù)據(jù),過去傳統(tǒng)一刀切、只聚焦所謂核心數(shù)據(jù)的容災(zāi)策略已經(jīng)不合時(shí)宜了。如今,業(yè)界普遍認(rèn)為針對(duì)數(shù)據(jù)屬性、使能需求需要采用“分而治之”的策略,通過有針對(duì)性的策略實(shí)現(xiàn)數(shù)據(jù)的有效保護(hù)與合理利用。

首先,針對(duì)生產(chǎn)業(yè)務(wù)的熱數(shù)據(jù)需要進(jìn)行全容災(zāi)。通過免網(wǎng)關(guān)雙活、兩地三中心等技術(shù)手段,實(shí)現(xiàn)生產(chǎn)級(jí)數(shù)據(jù)的全容災(zāi),一旦出現(xiàn)故障或者災(zāi)難,可以很快實(shí)現(xiàn)切換,保障業(yè)務(wù)連續(xù)在線運(yùn)行。

比如,《銀行業(yè)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)劃》最新規(guī)定,AB類業(yè)務(wù)災(zāi)難恢復(fù)等級(jí)要求在5級(jí)以上,業(yè)務(wù)中斷需要低于15分鐘??紤]到金融機(jī)構(gòu)業(yè)務(wù)一旦中斷就會(huì)對(duì)用戶體驗(yàn)和經(jīng)濟(jì)日?;顒?dòng)造成嚴(yán)重影響,像銀行等機(jī)構(gòu)實(shí)際部署的容災(zāi)業(yè)務(wù)系統(tǒng)RPO和RTO指標(biāo)要求會(huì)比行業(yè)規(guī)定更加苛刻。

其次,針對(duì)備份數(shù)據(jù)既需要有效保護(hù),又能實(shí)現(xiàn)合理利用,即溫?cái)?shù)據(jù)實(shí)現(xiàn)熱備份。備份數(shù)據(jù)是包含了不同歷史時(shí)間點(diǎn)的生產(chǎn)數(shù)據(jù)副本,一旦出現(xiàn)邏輯錯(cuò)誤或者人為誤操作,可以通過備份數(shù)據(jù)來實(shí)現(xiàn)數(shù)據(jù)的可恢復(fù)性。

如今,隨著數(shù)字化轉(zhuǎn)型的不斷深入,數(shù)據(jù)的規(guī)模與量級(jí)正在呈現(xiàn)指數(shù)級(jí)的增長(zhǎng),這也要求用戶在相對(duì)固定的備份時(shí)間窗口中盡快完成數(shù)據(jù)的備份,對(duì)于數(shù)據(jù)備份的性能和效率要求正在越來越高;與此同時(shí),為避免對(duì)生產(chǎn)系統(tǒng)運(yùn)行的影響,開發(fā)測(cè)試、數(shù)據(jù)挖掘等應(yīng)用會(huì)盡量使用備份數(shù)據(jù),從而增加了備份副本的使用用途和價(jià)值。

最后則是冷數(shù)據(jù)逐漸走向溫歸檔。眾所周知,不僅銀行、保險(xiǎn)等這些傳統(tǒng)行業(yè)對(duì)于數(shù)據(jù)有著嚴(yán)格的監(jiān)管要求,哪怕是互聯(lián)網(wǎng)行業(yè)對(duì)于生產(chǎn)數(shù)據(jù)、日志數(shù)據(jù)等都需要長(zhǎng)期保留,以用于追溯故障和各種問題,以備后續(xù)的審計(jì)。

以國(guó)內(nèi)一家直播巨頭為例,其每月直播所產(chǎn)生的數(shù)據(jù)就高達(dá)數(shù)PB,這些海量數(shù)據(jù)因?yàn)榉ㄒ?guī)要求,需要做長(zhǎng)達(dá)三個(gè)月的保留,并且在歸檔期間還會(huì)經(jīng)常因?yàn)榉ㄒ?guī)和審計(jì)的要求而被調(diào)用,對(duì)于歸檔數(shù)據(jù)的長(zhǎng)期保持和數(shù)據(jù)完整性有著極高要求。一位存儲(chǔ)技術(shù)專家就直言:“因?yàn)閷徲?jì)和歸檔法規(guī),現(xiàn)在幾乎所有行業(yè)都對(duì)數(shù)據(jù)歸檔有要求,金融等行業(yè)甚至要求數(shù)據(jù)存放時(shí)間達(dá)十年以上,需要確保數(shù)據(jù)不丟失。”

因此,應(yīng)用的多樣化、數(shù)據(jù)屬性的差異化以及法規(guī)遵從的硬性要求,驅(qū)動(dòng)著數(shù)據(jù)保護(hù)的走向精細(xì)化,也讓越來越多用戶重新審視災(zāi)備,并著手做出改變。

現(xiàn)在是時(shí)候重新審視災(zāi)備

事實(shí)上,近年來隨著一系列宕機(jī)、故障事件的發(fā)生,以及用戶自身數(shù)字化轉(zhuǎn)型中遇到的各種挑戰(zhàn),用戶在災(zāi)備建設(shè)上呈現(xiàn)出一些新的趨勢(shì)。

首先,隨著用戶業(yè)務(wù)加速走向數(shù)字化,數(shù)據(jù)中心規(guī)模、設(shè)備數(shù)量也隨之快速增加,某種程度也加大了設(shè)備故障發(fā)生的概率。因此,用戶在進(jìn)行災(zāi)備建設(shè)過程中依然會(huì)看重單點(diǎn)設(shè)備的可靠性。因?yàn)闊o論是分布式架構(gòu)產(chǎn)品,還是集中式架構(gòu)產(chǎn)品,單點(diǎn)設(shè)備的高可靠性的確可以降低故障發(fā)生的概率。

比如,我們現(xiàn)在看到一些高端存儲(chǔ)產(chǎn)品,可以實(shí)現(xiàn)八個(gè)控制器壞七個(gè)依然能夠運(yùn)行,將數(shù)據(jù)中心存儲(chǔ)可靠性提升到一個(gè)新高度。另外,集合分布式和集中式架構(gòu)各自優(yōu)勢(shì)的存儲(chǔ)產(chǎn)品被認(rèn)為未來數(shù)據(jù)中心存儲(chǔ)重要的發(fā)展方向,有望進(jìn)一步提升整個(gè)數(shù)據(jù)數(shù)據(jù)中心存儲(chǔ)層面的可靠性。

其次,完整的災(zāi)備架構(gòu)設(shè)計(jì)和合適的解決方案實(shí)施將會(huì)成為用戶災(zāi)備建設(shè)的必需。比如兩地三中心,甚至兩地四中心的方案會(huì)被更多用戶所接受與采納,而像免網(wǎng)關(guān)雙活這種方案不僅可以大幅降低故障切換的步驟與難度,還能有效讓RPO和RTO等關(guān)鍵指標(biāo)趨于零,必然會(huì)受到更多用戶所采用。

最后,過去災(zāi)備“中看不中用”的想法將會(huì)被徹底拋棄,用戶在理念層面將大幅重視災(zāi)備的建設(shè),進(jìn)一步推動(dòng)災(zāi)備建設(shè)走向落地,除了會(huì)繼續(xù)完善嚴(yán)格的流程規(guī)范之外,日常演練等工作也會(huì)被用戶所重視,真正讓災(zāi)備建設(shè)做到“中看又中用”。

總體來看,東京證券交易所的宕機(jī)事件猶如在數(shù)字化浪潮中給我們敲響了一次警鐘。對(duì)于所有用戶,現(xiàn)在時(shí)候重新審視災(zāi)備,并且著手改變現(xiàn)狀,為數(shù)字化轉(zhuǎn)型保駕護(hù)航。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-12-07
東京證交所宕機(jī)調(diào)查結(jié)果出爐,數(shù)據(jù)安全警鐘需長(zhǎng)鳴
我們需要真正深刻思考的是:在數(shù)字化浪潮滾滾而來的時(shí)代下,數(shù)據(jù)爆炸性增長(zhǎng)、數(shù)據(jù)價(jià)值加速凸顯、數(shù)據(jù)使能日趨迫切,保障業(yè)務(wù)連續(xù)性已成頭等大事,災(zāi)備建設(shè)的重要性是否引起大家足夠的重視、災(zāi)備架構(gòu)設(shè)計(jì)是否符合未來

長(zhǎng)按掃碼 閱讀全文