東京證交所宕機調(diào)查結果出爐,數(shù)據(jù)安全警鐘需長鳴

原標題:東京證交所宕機調(diào)查結果出爐,數(shù)據(jù)安全警鐘需長鳴

數(shù)據(jù)安全決定著一家企業(yè)的生死與未來。

這絕對不是危言聳聽。近幾年來,現(xiàn)實中慘痛教訓不斷上演:天津某醫(yī)院數(shù)據(jù)中心因持續(xù)大雨被淹,由于未做災備,導致醫(yī)院無法開展業(yè)務;某云服務商因為底層磁盤靜默錯誤以及數(shù)據(jù)遷移操作不規(guī)范,導致某用戶平臺級數(shù)據(jù)全部丟失,業(yè)務從此難以為繼;某互聯(lián)網(wǎng)技術服務商數(shù)據(jù)被惡意刪除,恢復耗時七天七夜,賠償客戶損失1.5億元……

最近一個鮮活的例子是,東京證券交易所在十一期間因為存儲故障導致業(yè)務大癱瘓,暫停交易一天,損失和影響不可估量。哪怕貴為全球第三大證券交易所的東京證券交易所,其IT建設經(jīng)驗如此豐富、IT基礎設施如此強大的情況下,當故障發(fā)生時,依然無法從容應對。此刻,不談災備,何來以后的數(shù)據(jù)安全。

正所謂“后人哀之而不鑒之,亦使后人復哀后人也!”這一切不禁讓人思考:過去的災備建設體系是否真的適合如今快速變化的數(shù)字化時代?未來容災的趨勢又會朝著哪些方向發(fā)展?

東京證券交易所事件引發(fā)的思考

今年十月一號,東京證券交易所因為存儲設備故障導致暫停交易一天。當時筆者就猜測,此次事故可能并不是簡單的設備故障而引起的。

果不其然,東京證券交易所宕機事故處理結果近日出爐。日本金融服務管理局(FSA)調(diào)查顯示,故障的根本原因是“故障設備出現(xiàn)了缺陷”;但由于“為故障設備制定的故障自動切換機制不夠到位,加上TSE沒有為交易恢復制定合適的規(guī)定”,最終導致了十月一號的混亂局面。

東京證券交易所經(jīng)歷大宕機

調(diào)查報告指出,當故障發(fā)生時,備用設備并沒有自動接管,之后只能通過人工方式,手動切換到備用設備。該報告甚至還發(fā)現(xiàn),該交易所并沒有制定恢復交易的程序,以防發(fā)生此類故障,而且缺乏明確的規(guī)定。

任何事件都不能孤立地去看待,如果脫離其所處的時代背景去分析則缺乏真正的借鑒意義。正如東京證券交易所宕機事件中,我們不能簡單將此次故障歸咎于富士通存儲設備的問題,因為硬件故障出現(xiàn)無可厚非,任何硬件都達不到100%的絕對安全可靠;我們亦不能簡單怪罪于恢復機制的缺陷,因為過去制定的規(guī)則與規(guī)范,隨著歲月的推移,無法適應新時代的變化。

我們需要真正深刻思考的是:在數(shù)字化浪潮滾滾而來的時代下,數(shù)據(jù)爆炸性增長、數(shù)據(jù)價值加速凸顯、數(shù)據(jù)使能日趨迫切,保障業(yè)務連續(xù)性已成頭等大事,災備建設的重要性是否引起大家足夠的重視、災備架構設計是否符合未來業(yè)務發(fā)展的需求、災備一系列流程規(guī)范是否真正具有可執(zhí)行性?

你是否真的了解數(shù)據(jù)災備需求

“過去會區(qū)分核心數(shù)據(jù)和非核心數(shù)據(jù)?,F(xiàn)在是所有數(shù)據(jù)都重要,所有數(shù)據(jù)都不能丟失?!币患胰揍t(yī)院信息中心主任今年接受大數(shù)據(jù)在線采訪時如是說。

這恰恰反映出數(shù)據(jù)的重要性今非昔比。數(shù)據(jù)正在成為最重要的生產(chǎn)要素之一,更是一切應用運轉(zhuǎn)的基礎。然而,數(shù)據(jù)保護的難度也不可同日而語。這些年,隨著云計算、大數(shù)據(jù)、人工智能等技術的不斷應用,直接驅(qū)動著新應用不斷涌現(xiàn),應用類型不僅走向復雜化和多元化,也帶動了數(shù)據(jù)類型走向多元化,給災備建設帶來了前所未有的挑戰(zhàn)。

以銀行為例,2019年銀行業(yè)共處理電子支付業(yè)務2233億筆,業(yè)務規(guī)模是2009年的40倍,小額、高頻支付場景正在迅速成為常態(tài),使得銀行的交易、清算等業(yè)務帶來了前所未有的交易頻次、數(shù)據(jù)規(guī)模以及對業(yè)務連續(xù)性的強需求。

“數(shù)字化轉(zhuǎn)型加速了企業(yè)業(yè)務走向線上化和數(shù)字化,對業(yè)務連續(xù)性要求變得極高?!比A為存儲技術專家告訴大數(shù)據(jù)在線。事實上的確如此,面對如此豐富的應用以及所產(chǎn)生的海量多元數(shù)據(jù),過去傳統(tǒng)一刀切、只聚焦所謂核心數(shù)據(jù)的容災策略已經(jīng)不合時宜了。如今,業(yè)界普遍認為針對數(shù)據(jù)屬性、使能需求需要采用“分而治之”的策略,通過有針對性的策略實現(xiàn)數(shù)據(jù)的有效保護與合理利用。

首先,針對生產(chǎn)業(yè)務的熱數(shù)據(jù)需要進行全容災。通過免網(wǎng)關雙活、兩地三中心等技術手段,實現(xiàn)生產(chǎn)級數(shù)據(jù)的全容災,一旦出現(xiàn)故障或者災難,可以很快實現(xiàn)切換,保障業(yè)務連續(xù)在線運行。

比如,《銀行業(yè)信息系統(tǒng)災難恢復規(guī)劃》最新規(guī)定,AB類業(yè)務災難恢復等級要求在5級以上,業(yè)務中斷需要低于15分鐘??紤]到金融機構業(yè)務一旦中斷就會對用戶體驗和經(jīng)濟日?;顒釉斐蓢乐赜绊?,像銀行等機構實際部署的容災業(yè)務系統(tǒng)RPO和RTO指標要求會比行業(yè)規(guī)定更加苛刻。

其次,針對備份數(shù)據(jù)既需要有效保護,又能實現(xiàn)合理利用,即溫數(shù)據(jù)實現(xiàn)熱備份。備份數(shù)據(jù)是包含了不同歷史時間點的生產(chǎn)數(shù)據(jù)副本,一旦出現(xiàn)邏輯錯誤或者人為誤操作,可以通過備份數(shù)據(jù)來實現(xiàn)數(shù)據(jù)的可恢復性。

如今,隨著數(shù)字化轉(zhuǎn)型的不斷深入,數(shù)據(jù)的規(guī)模與量級正在呈現(xiàn)指數(shù)級的增長,這也要求用戶在相對固定的備份時間窗口中盡快完成數(shù)據(jù)的備份,對于數(shù)據(jù)備份的性能和效率要求正在越來越高;與此同時,為避免對生產(chǎn)系統(tǒng)運行的影響,開發(fā)測試、數(shù)據(jù)挖掘等應用會盡量使用備份數(shù)據(jù),從而增加了備份副本的使用用途和價值。

最后則是冷數(shù)據(jù)逐漸走向溫歸檔。眾所周知,不僅銀行、保險等這些傳統(tǒng)行業(yè)對于數(shù)據(jù)有著嚴格的監(jiān)管要求,哪怕是互聯(lián)網(wǎng)行業(yè)對于生產(chǎn)數(shù)據(jù)、日志數(shù)據(jù)等都需要長期保留,以用于追溯故障和各種問題,以備后續(xù)的審計。

以國內(nèi)一家直播巨頭為例,其每月直播所產(chǎn)生的數(shù)據(jù)就高達數(shù)PB,這些海量數(shù)據(jù)因為法規(guī)要求,需要做長達三個月的保留,并且在歸檔期間還會經(jīng)常因為法規(guī)和審計的要求而被調(diào)用,對于歸檔數(shù)據(jù)的長期保持和數(shù)據(jù)完整性有著極高要求。一位存儲技術專家就直言:“因為審計和歸檔法規(guī),現(xiàn)在幾乎所有行業(yè)都對數(shù)據(jù)歸檔有要求,金融等行業(yè)甚至要求數(shù)據(jù)存放時間達十年以上,需要確保數(shù)據(jù)不丟失?!?/p>

因此,應用的多樣化、數(shù)據(jù)屬性的差異化以及法規(guī)遵從的硬性要求,驅(qū)動著數(shù)據(jù)保護的走向精細化,也讓越來越多用戶重新審視災備,并著手做出改變。

現(xiàn)在是時候重新審視災備

事實上,近年來隨著一系列宕機、故障事件的發(fā)生,以及用戶自身數(shù)字化轉(zhuǎn)型中遇到的各種挑戰(zhàn),用戶在災備建設上呈現(xiàn)出一些新的趨勢。

首先,隨著用戶業(yè)務加速走向數(shù)字化,數(shù)據(jù)中心規(guī)模、設備數(shù)量也隨之快速增加,某種程度也加大了設備故障發(fā)生的概率。因此,用戶在進行災備建設過程中依然會看重單點設備的可靠性。因為無論是分布式架構產(chǎn)品,還是集中式架構產(chǎn)品,單點設備的高可靠性的確可以降低故障發(fā)生的概率。

比如,我們現(xiàn)在看到一些高端存儲產(chǎn)品,可以實現(xiàn)八個控制器壞七個依然能夠運行,將數(shù)據(jù)中心存儲可靠性提升到一個新高度。另外,集合分布式和集中式架構各自優(yōu)勢的存儲產(chǎn)品被認為未來數(shù)據(jù)中心存儲重要的發(fā)展方向,有望進一步提升整個數(shù)據(jù)數(shù)據(jù)中心存儲層面的可靠性。

其次,完整的災備架構設計和合適的解決方案實施將會成為用戶災備建設的必需。比如兩地三中心,甚至兩地四中心的方案會被更多用戶所接受與采納,而像免網(wǎng)關雙活這種方案不僅可以大幅降低故障切換的步驟與難度,還能有效讓RPO和RTO等關鍵指標趨于零,必然會受到更多用戶所采用。

最后,過去災備“中看不中用”的想法將會被徹底拋棄,用戶在理念層面將大幅重視災備的建設,進一步推動災備建設走向落地,除了會繼續(xù)完善嚴格的流程規(guī)范之外,日常演練等工作也會被用戶所重視,真正讓災備建設做到“中看又中用”。

總體來看,東京證券交易所的宕機事件猶如在數(shù)字化浪潮中給我們敲響了一次警鐘。對于所有用戶,現(xiàn)在時候重新審視災備,并且著手改變現(xiàn)狀,為數(shù)字化轉(zhuǎn)型保駕護航。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2020-12-07
東京證交所宕機調(diào)查結果出爐,數(shù)據(jù)安全警鐘需長鳴
我們需要真正深刻思考的是:在數(shù)字化浪潮滾滾而來的時代下,數(shù)據(jù)爆炸性增長、數(shù)據(jù)價值加速凸顯、數(shù)據(jù)使能日趨迫切,保障業(yè)務連續(xù)性已成頭等大事,災備建設的重要性是否引起大家足夠的重視、災備架構設計是否符合未來

長按掃碼 閱讀全文