大數(shù)據(jù)“超能力”:數(shù)據(jù)安全和隱私該如何保障?

原標(biāo)題:大數(shù)據(jù)“超能力”:數(shù)據(jù)安全和隱私該如何保障?



人人都喜歡超級英雄。

不論是超人還是鋼鐵俠,又或者是小蜘蛛和綠巨人,幾乎每一個超級英雄漫畫及電影的粉絲,都曾為其不公遭遇打抱不平:“他們明明是在用超能力做好事,拯救人類的,為什么電影里的政府和平民會這么蠢,總對他們?nèi)狈π湃?,滿是提防?!?/p>

這就是所謂的“葉公好龍”了,因為當(dāng)你身邊真出現(xiàn)了個能把卡車當(dāng)皮球一樣拋來拋去的人時,你的反應(yīng)恐怕也好不到哪兒去,可能也巴不得有政府出面,逼他接受《超級英雄注冊法案》。

超級英雄和現(xiàn)實人類的差距就像人和螞蟻的區(qū)別,身為螞蟻,你敢冒險嗎?

這才是現(xiàn)實世界和真實人性面對超出理解且不可控現(xiàn)象時的正常反應(yīng),有超能力的人說他們只會把這些能力用在正道兒上,可誰敢百分百相信他們?

再說孰為善何為惡,又有誰能黑白分明地定義清楚?

類似的爭論到了這一步,可能就會有人出來打圓場說,不要較真兒,畢竟這個世界上并沒有超能力,又何必對虛構(gòu)的人物和故事有這么強的帶入感呢?

真的嗎朋友?

這個世界真的沒有“超能力”嗎?

說這話的人,一定是忘了“被大數(shù)據(jù)死死拿捏”的恐懼。

大數(shù)據(jù)就像威力無比的超能力,在它面前我們都是螻蟻。

互聯(lián)網(wǎng)上有一個被復(fù)用到濫的文案,大概意思就是:要發(fā)財,要早早實現(xiàn)財務(wù)自由,就要轉(zhuǎn)變思路。

拼體力無可厚非,但基本無法出頭;

拼腦力,效率高一些但也有限;

只有擁有信息差上的優(yōu)勢,才是正解。

這種優(yōu)勢,正是數(shù)據(jù)“超能力”的體現(xiàn)。

數(shù)據(jù)體量直接導(dǎo)致了信息差的存在。

這幾年產(chǎn)經(jīng)界對“數(shù)據(jù)資產(chǎn)化”概念的探索,實質(zhì)就是開始把蘊藏海量、高價值信息的大數(shù)據(jù)視作一種可以生錢的資產(chǎn)。

在這種觀念的引導(dǎo)下,各行各業(yè)都在大力拓展自己的數(shù)據(jù)儲備,不僅僅是擴展容量,還要盡可能地豐富其維度及來源,來強化質(zhì)量,也就是它們可供挖掘和利用的價值屬性。

這種觀念的影響力之大、見效之快,以至于不僅僅是大企業(yè)在修煉它,連街邊的小飯館也搞起了各種各樣的數(shù)據(jù)收集,消費的時候加個微信,還有用打折的幌子要求你關(guān)注他們的公眾號或用小程序點餐都成了常規(guī)動作。

可以說在這個時代,數(shù)據(jù)的資產(chǎn)化已成大勢所趨。誰掌握了更多這樣的資產(chǎn),誰就有可能賺到更多錢。

而且數(shù)據(jù)資產(chǎn)化,并不只是說數(shù)據(jù)更值錢了,還在于數(shù)據(jù)的應(yīng)用方法也可以資產(chǎn)化。

今年6月的2021BAAI智源大會上,清華大學(xué)國家金融研究院院長朱民就在演講中剖析了數(shù)據(jù)的經(jīng)濟學(xué)屬性和資產(chǎn)特性,要點有:

  • 數(shù)據(jù)的虛擬特性,使其可重復(fù)使用,且轉(zhuǎn)移和復(fù)制成本為零,非常適于分享;

  • 數(shù)據(jù)的流通就是知識的流通,這種流通可以讓它創(chuàng)造更大的價值;

  • 數(shù)據(jù)雖然開始資產(chǎn)化,但數(shù)據(jù)產(chǎn)權(quán)還是模糊的,如果依然沿用“誰采集誰擁有”那一套,數(shù)據(jù)隱私和安全問題就很難解決。

這幾點還是很好理解的,即數(shù)據(jù)資產(chǎn)不流通就會形成孤島,影響其價值最大化,但要流通順暢,就必須要以解決數(shù)據(jù)產(chǎn)權(quán)及隨之而來的安全和隱私問題為前提。

如果我們把大數(shù)據(jù)或數(shù)據(jù)資產(chǎn)看作超能力的話,這個命題就變成了:我們既期待這種超能力足夠強大,可以造福于大眾,又一定要確保它不會被任何人拿來作惡。

我看超級英雄電影的時候,總在想一個問題,大家動不動就飛天遁地炸大樓,那些樓里的人,怎么辦。

畢竟超能力是雙刃劍。

需要關(guān)在籠子里。

讓我們再短暫跳回到超級英雄的劇情中,蜘蛛俠的姨父在臨終前對他說:“能力越大、責(zé)任最大。”

很正能量是不是?

不過現(xiàn)實通常是:在能力越大后,能管住自己不濫用這種能力謀私的欲望,也就越難。

這些濫用,有些是有意識的,例如最近被主管機構(gòu)頻頻點名的“互聯(lián)網(wǎng)企業(yè)借大數(shù)據(jù)殺熟”現(xiàn)象,雖然借這種小手段能多收個三五斗,但這還不是真正的危險。

真正的危險,出在那些無意識地,或有意無意的數(shù)據(jù)泄露上。

正是因為數(shù)據(jù)的虛擬特性,還有零成本復(fù)制和轉(zhuǎn)移特性,它即使出現(xiàn)了損失或泄露,也很難被察覺,而等到個人隱私滿天飛的時候,再去做溯源,也是千難萬難了。

在這種情況下,數(shù)據(jù)“超能力”對普通人的打擊效果,或者說不對等性就會充分暴露出來了——單個用戶的數(shù)據(jù)對掌握它的企業(yè)或機構(gòu)來說只是九牛一毛,但其泄露的后果對這個用戶而言就如同“三體人”對上“地球人”,很可能是降維式、摧毀式的。

甚至你被賣了,你都不知道。

更甚至于,賣掉你,與你無關(guān)。

要知道這兩年,光是國外的大牌企業(yè)就有幾十家因數(shù)據(jù)泄露而公開道歉,而國內(nèi)的泄露現(xiàn)象就不用提了,說一句千瘡百孔、瘋狂側(cè)漏,一點都不過分。

咦,前面不是還說企業(yè)都把數(shù)據(jù)當(dāng)成寶藏當(dāng)成資產(chǎn)嘛?為什么數(shù)據(jù)隱私和安全問題還屢見不鮮呢?

原因其實也很簡單——這種對數(shù)據(jù)的重視,有相當(dāng)多數(shù)的企業(yè)還是停留在口頭上,或者說,只愿謀利而不愿負責(zé)。

國外此前就有個調(diào)查,結(jié)論是現(xiàn)在坐擁數(shù)據(jù)最多的互聯(lián)網(wǎng)公司,卻普遍認為搞信息安全是負收益行為,投入越多虧得越多。

他們認為數(shù)據(jù)安全是一種防衛(wèi)機制,而預(yù)防是沒有辦法計算KPI的,把威脅消滅在剛有苗頭的時候,在老板眼里就像是光吃飯不干活,這直接導(dǎo)致國內(nèi)外不少靠數(shù)據(jù)起家的企業(yè)在數(shù)據(jù)安全上基本都有一個較長的空窗期,誰都不愿意拿寶貴的發(fā)展資金來鞏固數(shù)據(jù)安全。

而且,我們剛剛還提到“有意無意”,即有些企業(yè)雖無意大力投入數(shù)據(jù)安全,因為遲遲不見收益,卻難免有內(nèi)鬼蓄意危害數(shù)據(jù)安全,因為轉(zhuǎn)手就是真金白銀,這才是最防不勝防的。

面對數(shù)據(jù)資產(chǎn)化、數(shù)據(jù)流通分享、數(shù)據(jù)安全和隱私保護這種千頭萬緒,彼此交織的復(fù)雜問題時,當(dāng)駝鳥或許也是一種態(tài)度,大不了數(shù)字化不搞了唄。

但回顧人類歷史,大數(shù)據(jù)可遠不是惟一的“超能力”。

幾乎每種重大技術(shù)發(fā)明都是某種“超能力”。

對比百多年前的人們,如今的我們活得就像“超人”一樣,僅出行就有汽車、高鐵和飛機,每一樣都能秒殺“八百里加急”。

所以如果大數(shù)據(jù)或數(shù)據(jù)資產(chǎn)化是我們進化所必需的“超能力”,那么回避是無意義的。

就像能力沒有善惡之分,關(guān)鍵是要看如何使用它,或者至少要給它的使用劃出一條底線,即數(shù)據(jù)隱私和安全一定要獲得保障。

道德是上限,法律是底線。確保數(shù)據(jù)安全,立法是關(guān)鍵。

對大數(shù)據(jù)產(chǎn)業(yè)略有了解的人,可能都聽說過歐盟的《通用數(shù)據(jù)保護條例》(GDPR),目前全世界范圍內(nèi)它可能是最嚴苛的數(shù)據(jù)隱私保護法規(guī)。

它到底嚴到什么地步,我們在這里不羅列枯燥的法條,就拿德國最大的醫(yī)療保險公司AOK正在推進的電子病歷(ePA)做個活生生的例子吧。

ePA頭頂GDPR和德國《患者數(shù)據(jù)保護法案》(PDSG)的規(guī)定,又是用于存儲診斷和治療數(shù)據(jù)、藥物治療計劃、過敏史和個人健康信息等高度敏感隱私型數(shù)據(jù),因此它將數(shù)據(jù)產(chǎn)權(quán)還給了個人,規(guī)定ePA所有數(shù)據(jù)歸受保的患者自己所有。

患者們不但有權(quán)自行決定ePA能存儲自己的哪些信息及保存時間是多久,也有權(quán)決定有哪些醫(yī)生能訪問這些信息。此外,醫(yī)療保險公司通常只有ePA的寫入權(quán)限而不能讀取,且寫入也要經(jīng)過患者的授權(quán)。

這樣一來,ePA先天就兼顧了數(shù)據(jù)流通方面的靈活性和安全需求,雖然它允許多方訪問其中的信息,但不同方對信息有不同程度的訪問權(quán)限,且這些權(quán)限及其期限并不固定,完全由患者說了算。

看起來很完美?

完美的規(guī)劃往往夭折在執(zhí)行中。

沒有“嚴格執(zhí)法”的“科學(xué)立法”就是開玩笑,數(shù)據(jù)安全保障要想在執(zhí)行中避免“打折”或“變味”,首先要盡量躲開人的因素。

因為人始終是人,再怎么努力用制度去限制人,人也做不到百分百的精確,所以在數(shù)據(jù)安全中要用技術(shù)手段跳過不靠譜的人類。

其次,考慮到數(shù)據(jù)資產(chǎn)的應(yīng)用是一個閉環(huán),從儲存、傳輸?shù)教幚淼娜魏我粋€環(huán)節(jié)都可能出現(xiàn)安全隱患,因此也要用技術(shù)手段在全鏈路上排除不確定因素,做到全方位的保護。

要做到這兩點,“技術(shù)”變成了關(guān)鍵詞,可數(shù)據(jù)安全領(lǐng)域發(fā)展了這么多年,好像到現(xiàn)在為止也沒有任何一項技術(shù)能夠確保數(shù)據(jù)的絕對安全呀。

這個判斷的確不假,不過如果能滿足有機融合和運用多項數(shù)據(jù)安全技術(shù),導(dǎo)入先進的基于硬件的安全技術(shù),以及補足數(shù)據(jù)處理階段的安全防護手段這幾個條件,還是能有立竿見影的效果。

AOK在推進ePA安全技術(shù)部署的過程中是怎么做的?

簡單來說,它的做法就是在既有各類數(shù)據(jù)安全防護方案的基礎(chǔ)上,重點加持了基于硬件的可信執(zhí)行環(huán)境(TEE)技術(shù)。

AOK這一舉措其實就是對上面幾個條件的充分貫徹。

其ePA涉及的數(shù)據(jù)的存儲和傳輸,都有了相對應(yīng)的加密技術(shù)和安全防護,但這些數(shù)據(jù)在系統(tǒng)內(nèi)的讀取和處理,卻需要以純文本或者說明文的形態(tài)運作,所以必須要有一個由TEE提供的受特別保護的高安全虛擬區(qū)域來防止非授權(quán)的應(yīng)用和用戶的訪問。

在TEE的具體技術(shù)實現(xiàn)上,AOK選擇了英特爾的軟件防護擴展(SGX)技術(shù),這正是一種基于硬件的、被集成在英特爾CPU中的、主要為數(shù)據(jù)處理過程提供安全防護的技術(shù)。

它可以借助CPU在內(nèi)存等特定硬件環(huán)境中構(gòu)造出一個可信的“安全隔離區(qū)”,用于容納那些需要在處理中被嚴密保護的應(yīng)用代碼和數(shù)據(jù)。

SGX厲害的地方就在于這些隔離區(qū),相當(dāng)于在系統(tǒng)內(nèi)創(chuàng)造了一個一個堅固的“城堡”,而且這些“城堡”能獨立于操作系統(tǒng)、虛擬機、BIOS等系統(tǒng)之外,即使這些底層系統(tǒng)全部淪陷,受保護的代碼和數(shù)據(jù)在這些“城堡”的保護下也能盡力擋開竊取或篡改它們的黑手。

SGX還為這些“城堡”的正規(guī)出入設(shè)定了周全的安保手段,只有真正擁有準(zhǔn)入權(quán)限且經(jīng)過嚴密安保檢查的用戶才能過關(guān)。

在AOK ePA的具體實施中,SGX的主要任務(wù)就是貼身保護其文件系統(tǒng),在它的幫助下,這個系統(tǒng)將授權(quán)、文檔管理和訪問網(wǎng)關(guān)結(jié)合在一起,確保只有經(jīng)過身份認證的授權(quán)用戶才能與ePA交互。

當(dāng)然,AOK看中SGX技術(shù)也有其他原因,畢竟英特爾今年發(fā)布的、面向主流單路和雙路服務(wù)器系統(tǒng)的全新第三代至強可擴展處理器不但集成了這種技術(shù),讓其部署更加順手,還對它進行了強化,讓它最高能在一個雙路系統(tǒng)上支持1TB的加密內(nèi)存區(qū)域,也就是上面提到的安全隔離區(qū),有容乃大嘛。

好的技術(shù),不僅國外在用,開始重視數(shù)據(jù)安全投入的中國企業(yè)也在嘗鮮。

看中SGX加密內(nèi)存區(qū)域夠大、安全隔離效果夠硬的平安、百度和銀聯(lián)等頭部企業(yè)也開始或已經(jīng)將它用于隱私保護機器學(xué)習(xí)或聯(lián)邦學(xué)習(xí)場景。

由于這些場景通常涉及多方參與的數(shù)據(jù)協(xié)同,如共同進行AI模型的訓(xùn)練或推理,且每一方都不希望自己提供的數(shù)據(jù)出現(xiàn)安全問題,但又不得不面對各自的數(shù)據(jù)和共同訓(xùn)練使用的模型在處理前會被解密,將暴露在真空中的風(fēng)險,為了避開一些專門針對內(nèi)存下手,從內(nèi)存里竊取過路數(shù)據(jù)的威脅,就離不開像SGX這類技術(shù)的保護。

因為對于頭部企業(yè)而言,數(shù)據(jù)安全其實比業(yè)務(wù)更重要。

后者關(guān)乎賺錢多少。

前者是無法計算的價值和責(zé)任。

不論未來數(shù)據(jù)的產(chǎn)權(quán)是會明確歸屬其產(chǎn)出者,還是繼續(xù)目前“誰收集誰擁有”的潛規(guī)則,所有坐擁并享受數(shù)據(jù)資產(chǎn)收益的企業(yè)都不可掉以輕心。

數(shù)據(jù)的規(guī)模越大、質(zhì)量越高,其泄露的問題就越嚴峻,后果也越惡劣,它傷害的已經(jīng)不僅僅是普通人,企業(yè)再家大業(yè)大,也難逃厄運。

現(xiàn)在懈怠一時爽,等到需要一個數(shù)據(jù)安全反面典型的時候,誰能知道正在建立健全數(shù)據(jù)安全和隱私保護法規(guī)的中國不會出現(xiàn)一個價值700億,甚至更重的罰款案例?

至少有一點已經(jīng)很明確,那就是中國相關(guān)的立法進程正在加速,而且會更加完善,達到逼近歐盟標(biāo)準(zhǔn)甚至可能反超歐盟標(biāo)準(zhǔn)的那種完善,如果企業(yè)到那時才開始研究怎么構(gòu)建安全陣地,就太遲了。

所以要做數(shù)據(jù)安全就要從現(xiàn)在開始,從改變規(guī)則和升級技術(shù)做起,軟件、硬件、人、流程……方方面面都要完善起來。

保護用戶就是保護自己,越是數(shù)據(jù)發(fā)達,越是應(yīng)該小心翼翼。

野蠻生長的時代過去了,一切都要回歸秩序,不管是為了用戶,還是為了自己,或者為了那永無止境的數(shù)據(jù)分析和算法訓(xùn)練,數(shù)據(jù)安全是時候跳到工作日程的前面來了。

失去利潤,失去很多。

失去安全,失去一切。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-09-23
大數(shù)據(jù)“超能力”:數(shù)據(jù)安全和隱私該如何保障?
在這種情況下,數(shù)據(jù)“超能力”對普通人的打擊效果,或者說不對等性就會充分暴露出來了——單個用戶的數(shù)據(jù)對掌握它的企業(yè)或機構(gòu)來說只是九牛一毛,但其泄露的后果對這個用戶而言就如同“三體人”對上“地球人”,很

長按掃碼 閱讀全文