東京證交所宕機調(diào)查結(jié)果出爐,數(shù)據(jù)安全警鐘需長鳴

數(shù)據(jù)安全決定著一家企業(yè)的生死與未來。

這絕對不是危言聳聽。近幾年來,現(xiàn)實中慘痛教訓不斷上演:天津某醫(yī)院數(shù)據(jù)中心因持續(xù)大雨被淹,由于未做災備,導致醫(yī)院無法開展業(yè)務(wù);某云服務(wù)商因為底層磁盤靜默錯誤以及數(shù)據(jù)遷移操作不規(guī)范,導致某用戶平臺級數(shù)據(jù)全部丟失,業(yè)務(wù)從此難以為繼;某互聯(lián)網(wǎng)技術(shù)服務(wù)商數(shù)據(jù)被惡意刪除,恢復耗時七天七夜,賠償客戶損失1.5億元……

最近一個鮮活的例子是,東京證券交易所在十一期間因為存儲故障導致業(yè)務(wù)大癱瘓,暫停交易一天,損失和影響不可估量。哪怕貴為全球第三大證券交易所的東京證券交易所,其IT建設(shè)經(jīng)驗如此豐富、IT基礎(chǔ)設(shè)施如此強大的情況下,當故障發(fā)生時,依然無法從容應(yīng)對。此刻,不談災備,何來以后的數(shù)據(jù)安全。

正所謂“后人哀之而不鑒之,亦使后人復哀后人也!”這一切不禁讓人思考:過去的災備建設(shè)體系是否真的適合如今快速變化的數(shù)字化時代?未來容災的趨勢又會朝著哪些方向發(fā)展?

東京證券交易所事件引發(fā)的思考

今年十月一號,東京證券交易所因為存儲設(shè)備故障導致暫停交易一天。當時筆者就猜測,此次事故可能并不是簡單的設(shè)備故障而引起的。

果不其然,東京證券交易所宕機事故處理結(jié)果近日出爐。日本金融服務(wù)管理局(FSA)調(diào)查顯示,故障的根本原因是“故障設(shè)備出現(xiàn)了缺陷”;但由于“為故障設(shè)備制定的故障自動切換機制不夠到位,加上TSE沒有為交易恢復制定合適的規(guī)定”,最終導致了十月一號的混亂局面。

東京證券交易所經(jīng)歷大宕機

調(diào)查報告指出,當故障發(fā)生時,備用設(shè)備并沒有自動接管,之后只能通過人工方式,手動切換到備用設(shè)備。該報告甚至還發(fā)現(xiàn),該交易所并沒有制定恢復交易的程序,以防發(fā)生此類故障,而且缺乏明確的規(guī)定。

任何事件都不能孤立地去看待,如果脫離其所處的時代背景去分析則缺乏真正的借鑒意義。正如東京證券交易所宕機事件中,我們不能簡單將此次故障歸咎于富士通存儲設(shè)備的問題,因為硬件故障出現(xiàn)無可厚非,任何硬件都達不到100%的絕對安全可靠;我們亦不能簡單怪罪于恢復機制的缺陷,因為過去制定的規(guī)則與規(guī)范,隨著歲月的推移,無法適應(yīng)新時代的變化。

我們需要真正深刻思考的是:在數(shù)字化浪潮滾滾而來的時代下,數(shù)據(jù)爆炸性增長、數(shù)據(jù)價值加速凸顯、數(shù)據(jù)使能日趨迫切,保障業(yè)務(wù)連續(xù)性已成頭等大事,災備建設(shè)的重要性是否引起大家足夠的重視、災備架構(gòu)設(shè)計是否符合未來業(yè)務(wù)發(fā)展的需求、災備一系列流程規(guī)范是否真正具有可執(zhí)行性?

你是否真的了解數(shù)據(jù)災備需求

“過去會區(qū)分核心數(shù)據(jù)和非核心數(shù)據(jù)?,F(xiàn)在是所有數(shù)據(jù)都重要,所有數(shù)據(jù)都不能丟失?!币患胰揍t(yī)院信息中心主任今年接受大數(shù)據(jù)在線采訪時如是說。

這恰恰反映出數(shù)據(jù)的重要性今非昔比。數(shù)據(jù)正在成為最重要的生產(chǎn)要素之一,更是一切應(yīng)用運轉(zhuǎn)的基礎(chǔ)。然而,數(shù)據(jù)保護的難度也不可同日而語。這些年,隨著云計算、大數(shù)據(jù)、人工智能等技術(shù)的不斷應(yīng)用,直接驅(qū)動著新應(yīng)用不斷涌現(xiàn),應(yīng)用類型不僅走向復雜化和多元化,也帶動了數(shù)據(jù)類型走向多元化,給災備建設(shè)帶來了前所未有的挑戰(zhàn)。

以銀行為例,2019年銀行業(yè)共處理電子支付業(yè)務(wù)2233億筆,業(yè)務(wù)規(guī)模是2009年的40倍,小額、高頻支付場景正在迅速成為常態(tài),使得銀行的交易、清算等業(yè)務(wù)帶來了前所未有的交易頻次、數(shù)據(jù)規(guī)模以及對業(yè)務(wù)連續(xù)性的強需求。

“數(shù)字化轉(zhuǎn)型加速了企業(yè)業(yè)務(wù)走向線上化和數(shù)字化,對業(yè)務(wù)連續(xù)性要求變得極高?!比A為存儲技術(shù)專家告訴大數(shù)據(jù)在線。事實上的確如此,面對如此豐富的應(yīng)用以及所產(chǎn)生的海量多元數(shù)據(jù),過去傳統(tǒng)一刀切、只聚焦所謂核心數(shù)據(jù)的容災策略已經(jīng)不合時宜了。如今,業(yè)界普遍認為針對數(shù)據(jù)屬性、使能需求需要采用“分而治之”的策略,通過有針對性的策略實現(xiàn)數(shù)據(jù)的有效保護與合理利用。

首先,針對生產(chǎn)業(yè)務(wù)的熱數(shù)據(jù)需要進行全容災。通過免網(wǎng)關(guān)雙活、兩地三中心等技術(shù)手段,實現(xiàn)生產(chǎn)級數(shù)據(jù)的全容災,一旦出現(xiàn)故障或者災難,可以很快實現(xiàn)切換,保障業(yè)務(wù)連續(xù)在線運行。

比如,《銀行業(yè)信息系統(tǒng)災難恢復規(guī)劃》最新規(guī)定,AB類業(yè)務(wù)災難恢復等級要求在5級以上,業(yè)務(wù)中斷需要低于15分鐘??紤]到金融機構(gòu)業(yè)務(wù)一旦中斷就會對用戶體驗和經(jīng)濟日?;顒釉斐蓢乐赜绊?,像銀行等機構(gòu)實際部署的容災業(yè)務(wù)系統(tǒng)RPO和RTO指標要求會比行業(yè)規(guī)定更加苛刻。

其次,針對備份數(shù)據(jù)既需要有效保護,又能實現(xiàn)合理利用,即溫數(shù)據(jù)實現(xiàn)熱備份。備份數(shù)據(jù)是包含了不同歷史時間點的生產(chǎn)數(shù)據(jù)副本,一旦出現(xiàn)邏輯錯誤或者人為誤操作,可以通過備份數(shù)據(jù)來實現(xiàn)數(shù)據(jù)的可恢復性。

如今,隨著數(shù)字化轉(zhuǎn)型的不斷深入,數(shù)據(jù)的規(guī)模與量級正在呈現(xiàn)指數(shù)級的增長,這也要求用戶在相對固定的備份時間窗口中盡快完成數(shù)據(jù)的備份,對于數(shù)據(jù)備份的性能和效率要求正在越來越高;與此同時,為避免對生產(chǎn)系統(tǒng)運行的影響,開發(fā)測試、數(shù)據(jù)挖掘等應(yīng)用會盡量使用備份數(shù)據(jù),從而增加了備份副本的使用用途和價值。

最后則是冷數(shù)據(jù)逐漸走向溫歸檔。眾所周知,不僅銀行、保險等這些傳統(tǒng)行業(yè)對于數(shù)據(jù)有著嚴格的監(jiān)管要求,哪怕是互聯(lián)網(wǎng)行業(yè)對于生產(chǎn)數(shù)據(jù)、日志數(shù)據(jù)等都需要長期保留,以用于追溯故障和各種問題,以備后續(xù)的審計。

以國內(nèi)一家直播巨頭為例,其每月直播所產(chǎn)生的數(shù)據(jù)就高達數(shù)PB,這些海量數(shù)據(jù)因為法規(guī)要求,需要做長達三個月的保留,并且在歸檔期間還會經(jīng)常因為法規(guī)和審計的要求而被調(diào)用,對于歸檔數(shù)據(jù)的長期保持和數(shù)據(jù)完整性有著極高要求。一位存儲技術(shù)專家就直言:“因為審計和歸檔法規(guī),現(xiàn)在幾乎所有行業(yè)都對數(shù)據(jù)歸檔有要求,金融等行業(yè)甚至要求數(shù)據(jù)存放時間達十年以上,需要確保數(shù)據(jù)不丟失?!?/p>

因此,應(yīng)用的多樣化、數(shù)據(jù)屬性的差異化以及法規(guī)遵從的硬性要求,驅(qū)動著數(shù)據(jù)保護的走向精細化,也讓越來越多用戶重新審視災備,并著手做出改變。

現(xiàn)在是時候重新審視災備

事實上,近年來隨著一系列宕機、故障事件的發(fā)生,以及用戶自身數(shù)字化轉(zhuǎn)型中遇到的各種挑戰(zhàn),用戶在災備建設(shè)上呈現(xiàn)出一些新的趨勢。

首先,隨著用戶業(yè)務(wù)加速走向數(shù)字化,數(shù)據(jù)中心規(guī)模、設(shè)備數(shù)量也隨之快速增加,某種程度也加大了設(shè)備故障發(fā)生的概率。因此,用戶在進行災備建設(shè)過程中依然會看重單點設(shè)備的可靠性。因為無論是分布式架構(gòu)產(chǎn)品,還是集中式架構(gòu)產(chǎn)品,單點設(shè)備的高可靠性的確可以降低故障發(fā)生的概率。

比如,我們現(xiàn)在看到一些高端存儲產(chǎn)品,可以實現(xiàn)八個控制器壞七個依然能夠運行,將數(shù)據(jù)中心存儲可靠性提升到一個新高度。另外,集合分布式和集中式架構(gòu)各自優(yōu)勢的存儲產(chǎn)品被認為未來數(shù)據(jù)中心存儲重要的發(fā)展方向,有望進一步提升整個數(shù)據(jù)數(shù)據(jù)中心存儲層面的可靠性。

其次,完整的災備架構(gòu)設(shè)計和合適的解決方案實施將會成為用戶災備建設(shè)的必需。比如兩地三中心,甚至兩地四中心的方案會被更多用戶所接受與采納,而像免網(wǎng)關(guān)雙活這種方案不僅可以大幅降低故障切換的步驟與難度,還能有效讓RPO和RTO等關(guān)鍵指標趨于零,必然會受到更多用戶所采用。

最后,過去災備“中看不中用”的想法將會被徹底拋棄,用戶在理念層面將大幅重視災備的建設(shè),進一步推動災備建設(shè)走向落地,除了會繼續(xù)完善嚴格的流程規(guī)范之外,日常演練等工作也會被用戶所重視,真正讓災備建設(shè)做到“中看又中用”。

總體來看,東京證券交易所的宕機事件猶如在數(shù)字化浪潮中給我們敲響了一次警鐘。對于所有用戶,現(xiàn)在時候重新審視災備,并且著手改變現(xiàn)狀,為數(shù)字化轉(zhuǎn)型保駕護航。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-12-07
東京證交所宕機調(diào)查結(jié)果出爐,數(shù)據(jù)安全警鐘需長鳴
我們需要真正深刻思考的是:在數(shù)字化浪潮滾滾而來的時代下,數(shù)據(jù)爆炸性增長、數(shù)據(jù)價值加速凸顯、數(shù)據(jù)使能日趨迫切,保障業(yè)務(wù)連續(xù)性已成頭等大事,災備建設(shè)的重要性是否引起大家足夠的重視、災備架構(gòu)設(shè)計是否符合未來

長按掃碼 閱讀全文