揭秘:中移軟件全生命周期數(shù)據(jù)安全防護(hù)平臺(tái)

先后參與集團(tuán)OSS4.0、集團(tuán)集中化經(jīng)分、內(nèi)蒙古大數(shù)據(jù)平臺(tái)、上海統(tǒng)一匯聚平臺(tái)等大型項(xiàng)目建設(shè),參與《中國(guó)移動(dòng)大數(shù)據(jù)安全防護(hù)技術(shù)實(shí)施指南》規(guī)范撰寫(xiě),負(fù)責(zé)Hadoop平臺(tái)安全技術(shù)研究項(xiàng)目、“門(mén)神計(jì)劃”防數(shù)據(jù)泄漏系統(tǒng)項(xiàng)目等多個(gè)安全項(xiàng)目。為中國(guó)移動(dòng)集團(tuán)公司技術(shù)咨詢(xún)委員會(huì)安全領(lǐng)域?qū)<医M成員。

關(guān)于大數(shù)據(jù)安全的思考

中移軟件多年來(lái)一直致力于大數(shù)據(jù)平臺(tái)建設(shè),為中國(guó)移動(dòng)提供大數(shù)據(jù)平臺(tái)建設(shè)和服務(wù)能力。

在建設(shè)實(shí)踐過(guò)程中,我們一直在思考大數(shù)據(jù)平臺(tái)安全與傳統(tǒng)數(shù)據(jù)安全的區(qū)別。從本身特征來(lái)看,大數(shù)據(jù)平臺(tái)數(shù)據(jù)量大、數(shù)據(jù)涉敏,同時(shí)大數(shù)據(jù)平臺(tái)底層為開(kāi)源組件。從外部環(huán)境來(lái)看,GDPR和網(wǎng)絡(luò)安全法都關(guān)注個(gè)人隱私數(shù)據(jù),最近頻發(fā)的安全事件也注意是數(shù)據(jù)泄露事件。

此前平臺(tái)建設(shè)實(shí)踐更多的關(guān)注于平臺(tái)本身,我們做了漏洞掃描工具等,但是都是獨(dú)立于數(shù)據(jù)采集、存儲(chǔ)、處理、共享過(guò)程之外的,要真正保障大數(shù)據(jù)平臺(tái)數(shù)據(jù)的安全,必須關(guān)注數(shù)據(jù)本身,關(guān)注數(shù)據(jù)生命周期,也就必須與數(shù)據(jù)采集、存儲(chǔ)、處理、共享完全結(jié)合,不能游離在大數(shù)據(jù)處理流程之外。

全生命周期數(shù)據(jù)安全防護(hù)平臺(tái)

我們將數(shù)據(jù)全生命周期精簡(jiǎn)定義為“采集傳輸-存儲(chǔ)處理-數(shù)據(jù)共享”三大部分流程,其中數(shù)據(jù)采集過(guò)程涉及平臺(tái)外與平臺(tái)內(nèi)之間的數(shù)據(jù)交互,存儲(chǔ)處理為平臺(tái)內(nèi)處理過(guò)程,數(shù)據(jù)共享為平臺(tái)內(nèi)與平臺(tái)外之間的數(shù)據(jù)交互。同時(shí)對(duì)全過(guò)程通過(guò)安全態(tài)勢(shì)感知平臺(tái)進(jìn)行檢測(cè)和預(yù)警。

圖1 數(shù)據(jù)全生命周期

數(shù)據(jù)采集傳輸安全防護(hù)

  • 采集過(guò)程主要包括:

配置采集數(shù)據(jù)源、配置采集流程(含建目標(biāo)表)、調(diào)度監(jiān)控采集流程、采集數(shù)據(jù)傳輸四步。

  • 配置采集數(shù)據(jù)源過(guò)程:

主要通過(guò)采集白名單配置、數(shù)據(jù)源操作權(quán)限管理等手段進(jìn)行安全防護(hù)

  • 配置采集流程(含建目標(biāo)表):

主要通過(guò)事前敏感字段標(biāo)注、安全級(jí)別設(shè)置、靜態(tài)脫敏等方式進(jìn)行安全防護(hù)

  • 調(diào)度監(jiān)控采集流程:

通過(guò)應(yīng)用程序賬號(hào)認(rèn)證、流程監(jiān)控告警、資源相互隔離等方式保障

  • 采集數(shù)據(jù)傳輸流程:

通過(guò)傳輸加密等方式保障

圖2 數(shù)據(jù)采集傳輸過(guò)程-靜態(tài)脫敏

數(shù)據(jù)存儲(chǔ)處理安全防護(hù)

敏感數(shù)據(jù)存儲(chǔ)是大數(shù)據(jù)安全的難題。全生命周數(shù)據(jù)安全防護(hù)平臺(tái)提供透明加密和數(shù)據(jù)完整性檢查兩種解決方案,加固數(shù)據(jù)存儲(chǔ)環(huán)節(jié),提高數(shù)據(jù)存儲(chǔ)安全性。但是加密存儲(chǔ)對(duì)平臺(tái)性能影響大,同時(shí)對(duì)使用造成較大影響,因此一般敏感級(jí)別的數(shù)據(jù)不建議加密存儲(chǔ)。

中移軟件全生命周期數(shù)據(jù)安全防護(hù)平臺(tái)更重視使用過(guò)程的安全,使用過(guò)程分4種不同場(chǎng)景進(jìn)行防護(hù)。以數(shù)據(jù)使用場(chǎng)景 “用戶(hù)ABC對(duì)A表X字段進(jìn)行查詢(xún)操作”為例,通過(guò)不同的技術(shù)手段,實(shí)現(xiàn)4種不同層級(jí)的使用防護(hù)。

  • 場(chǎng)景1:

對(duì)不起,您對(duì)A表的訪問(wèn)權(quán)限僅限訪問(wèn)Y字段,無(wú)權(quán)訪問(wèn)X字段。該場(chǎng)景使用行列細(xì)粒度權(quán)限管控技術(shù)實(shí)現(xiàn)細(xì)粒度數(shù)據(jù)權(quán)限管控。

  • 場(chǎng)景2:

對(duì)不起,您對(duì)A表的操作權(quán)限僅限插入數(shù)據(jù),無(wú)法查詢(xún)數(shù)據(jù)。該場(chǎng)景使用操作細(xì)粒度權(quán)限管控技術(shù)實(shí)現(xiàn)細(xì)粒度操作權(quán)限管控。

  • 場(chǎng)景3:

對(duì)不起,該操作涉敏,需要XXX審批,審批后可執(zhí)行。該場(chǎng)景將傳統(tǒng)數(shù)據(jù)安全手段移植至大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)敏感重要操作的多人協(xié)同。

  • 場(chǎng)景4:

對(duì)不起,該操作涉敏,查詢(xún)結(jié)果已自動(dòng)脫敏為“188****9672”。該場(chǎng)景通過(guò)動(dòng)態(tài)脫敏技術(shù),使得不同使用者對(duì)涉敏數(shù)據(jù)操作得到不同結(jié)果。

圖3 數(shù)據(jù)存儲(chǔ)使用過(guò)程-金庫(kù)模式

數(shù)據(jù)共享安全防護(hù)

數(shù)據(jù)對(duì)外共享一般包括兩種方式:

接口方式和文件方式。

  • 接口方式

包括接口數(shù)據(jù)(JSON/XML)、流式數(shù)據(jù)(Kafka)等多種數(shù)據(jù)訪問(wèn)方式。我們通過(guò)API操作權(quán)限管理、API流量管控、API認(rèn)證管理等手段實(shí)現(xiàn)接口管控。

  • 文件方式

主要指通過(guò)FTP、SFTP、郵件等對(duì)外共享數(shù)據(jù),數(shù)據(jù)類(lèi)型包括TXT、CSV、Word、PPT、Excel、網(wǎng)頁(yè)等,平臺(tái)通過(guò)數(shù)字暗水印進(jìn)行安全防護(hù)。數(shù)字水印通過(guò)對(duì)文本(TXT、CSV、Word、PPT、Excel、網(wǎng)頁(yè)等)嵌入暗水印作為標(biāo)記一起傳輸,保障數(shù)據(jù)在發(fā)生泄漏時(shí),能夠提取水印信息并追蹤至責(zé)任人,達(dá)到事后安全保護(hù)的目的。企業(yè)安全管理員、文檔管理員等可以通過(guò)水印嵌入、水印提取功能,有效追溯外泄源頭,實(shí)現(xiàn)共享數(shù)據(jù)泄露的事后追蹤。解決了數(shù)據(jù)泄露后無(wú)法追蹤、難以定責(zé)、難以避免再發(fā)生的問(wèn)題。

圖4 數(shù)據(jù)共享過(guò)程-數(shù)字水印

全流程安全態(tài)勢(shì)感知

安全態(tài)勢(shì)感知依托于對(duì)大數(shù)據(jù)平臺(tái)操作行為的審計(jì),對(duì)Hadoop集群業(yè)務(wù)進(jìn)行安全監(jiān)控,重點(diǎn)對(duì)用戶(hù)的內(nèi)部違規(guī)行為進(jìn)行采集分析、監(jiān)控和畫(huà)像,是一種企業(yè)業(yè)務(wù)型的態(tài)勢(shì)感知。通過(guò)“采集-分析-感知-告警”實(shí)現(xiàn)安全事件的有效感知,利用數(shù)據(jù)可視化技術(shù)實(shí)現(xiàn)整體風(fēng)險(xiǎn)態(tài)勢(shì)的直觀化呈現(xiàn)。

圖5 全過(guò)程-安全態(tài)勢(shì)感知

核心技術(shù)解析

在全生命周期數(shù)據(jù)安全防護(hù)平臺(tái)中,使用到大數(shù)據(jù)技術(shù)、傳輸數(shù)據(jù)安全技術(shù)以及AI技術(shù),具體包括以下方面:

結(jié)語(yǔ)

從產(chǎn)品可用到安全有效之間,還存在很大的鴻溝,例如庫(kù)表敏感級(jí)別定義、字段敏感標(biāo)注、對(duì)應(yīng)的安全策略設(shè)置(動(dòng)態(tài)脫敏、靜態(tài)脫敏、金庫(kù)、存儲(chǔ)周期、加密算法)等,均暫無(wú)可直接借鑒的案例。這些實(shí)際的落地需要更多的業(yè)務(wù)人員參與進(jìn)來(lái)細(xì)化,使得大數(shù)據(jù)平臺(tái)真正實(shí)現(xiàn)數(shù)據(jù)全生命周期安全防護(hù)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-01-09
揭秘:中移軟件全生命周期數(shù)據(jù)安全防護(hù)平臺(tái)
揭秘:中移軟件全生命周期數(shù)據(jù)安全防護(hù)平臺(tái),先后參與集團(tuán)OSS4.0、集團(tuán)集中化經(jīng)分、內(nèi)蒙古大數(shù)據(jù)平臺(tái)、上海統(tǒng)一匯聚平臺(tái)等大型項(xiàng)目建設(shè),參與《中

長(zhǎng)按掃碼 閱讀全文