隱私數(shù)據(jù)不再安全,隱私計算站上隱私保護(hù)的“風(fēng)口”

文/陳根

隨著云計算、物聯(lián)網(wǎng)與大數(shù)據(jù)等技術(shù)的不斷發(fā)展,信息系統(tǒng)服務(wù)中針對用戶數(shù)據(jù)的收集整理、分析預(yù)測手段不斷成熟。各種基于位置跟蹤、行為偏好記錄所產(chǎn)生的定向服務(wù),為人們?nèi)粘I钐峁┲T多便利的同時,也越來越多得引發(fā)了隱私關(guān)注。

一方面,人們通過社交媒體進(jìn)行信息交換與自我表露,在網(wǎng)購平臺進(jìn)行購買行為,利用智能交通系統(tǒng)實現(xiàn)實時路況查詢。在參與這些在線服務(wù)的過程中,產(chǎn)生的大量數(shù)據(jù)讓人們不可避免地面臨隱私泄漏問題。

另一方面,數(shù)據(jù)作為現(xiàn)代商業(yè)與個人的核心價值與重要資產(chǎn),正在重新塑造人類生活的方方面面。IDC Research統(tǒng)計,2019年大數(shù)據(jù)和分析市場的銷售收入約為1870億美元。但由于數(shù)據(jù)本身可復(fù)制,易傳播,一經(jīng)分享無法追蹤,數(shù)據(jù)資產(chǎn)的確權(quán)困難。隨著數(shù)據(jù)隱私監(jiān)管日益加強,商業(yè)化被嚴(yán)重制約。

正是在這樣的背景下,隱私計算站在了隱私保護(hù)的“風(fēng)口”上。

隱私保護(hù)之痛

數(shù)字經(jīng)濟時代下,數(shù)據(jù)作為生產(chǎn)要素的重要性日益凸顯。加上數(shù)據(jù)的頻繁泄露,數(shù)據(jù)隱私安全成了時下亟待解決之痛。而現(xiàn)有的隱私保護(hù)主要從信息處理過程中的隱私保護(hù)、隱私度量與評估兩個方面入手。

從信息處理過程中的隱私保護(hù)方法來看,主要分為訪問控制技術(shù)方法、信息混淆技術(shù)方法、密碼學(xué)技術(shù)方法三類。

訪問控制技術(shù)通過制定信息資源的訪問策略以保證只有被授權(quán)的主體才能訪問信息,從而實現(xiàn)信息的隱私保護(hù)。近年來,多個基于訪問控制的隱私保護(hù)方案相繼提出。比如,基于強制訪問控制(MAC)模型的高可用智能卡隱私保護(hù)方案;基于自主訪問控制(DAC)模型的外包數(shù)據(jù)存儲隱私保護(hù)方案;基于角色訪問控制適用于多場景的隱私保護(hù)的數(shù)據(jù)挖掘方法等。

信息混淆技術(shù)是基于特定策略修改真實的原始數(shù)據(jù),使攻擊者無法通過發(fā)布后的數(shù)據(jù)來獲取真實數(shù)據(jù)信息,進(jìn)而實現(xiàn)隱私保護(hù)。其中,k-匿名、l-多樣性和t-近鄰等多種匿名化技術(shù)通過將用戶的原始數(shù)據(jù)隱藏到一個匿名空間中實現(xiàn)敏感信息的隱私保護(hù)。

密碼學(xué)技術(shù)是利用加密技術(shù)和陷門函數(shù),使攻擊者在無法獲得密鑰情況下不能得到用戶隱私信息。為了保護(hù)云計算中用戶的隱私信息,研究人員出了同態(tài)加密的概念,基于同態(tài)加密而構(gòu)造了隱私保護(hù)的空間多邊形查詢方案。

但無論是訪問控制技術(shù)方法、信息混淆技術(shù)方法、密碼學(xué)技術(shù)方法的隱私保護(hù)方案都主要是針對特定場景局部數(shù)據(jù)集的具體算法,缺少針對特定場景動態(tài)數(shù)據(jù)集的算法框架,更缺少適應(yīng)多場景動態(tài)數(shù)據(jù)集的普適性算法框架。此外,針對多媒體數(shù)據(jù)需要多個隱私保護(hù)算法的組合,而目前也缺少成熟的方案。最后,將不同隱私保護(hù)算法互相疊加以獲得更好保護(hù)效果的方法也有待開展研究。

隱私度量與評估通常從披露風(fēng)險和信息缺損兩個角度對隱私保護(hù)的效果進(jìn)行度量。事實上,現(xiàn)有的隱私度量都可以統(tǒng)一用披露風(fēng)險(Disclosure Risk)來描述,即攻擊者根據(jù)所發(fā)布的數(shù)據(jù)和其他背景知識可能披露隱私的概率。通常,關(guān)于隱私數(shù)據(jù)的背景知識越多,披露風(fēng)險越大。信息缺損則表示經(jīng)過隱私保護(hù)技術(shù)處理之后原始數(shù)據(jù)的信息丟失量,是針對發(fā)布數(shù)據(jù)集質(zhì)量的一種度量方法。

此外,隱私度量與評估的應(yīng)用領(lǐng)域主要聚焦在社交網(wǎng)絡(luò)、位置服務(wù)、云計算等方面。在社交網(wǎng)絡(luò)領(lǐng)域方面,研究人員提出了針對網(wǎng)頁搜索中基于混淆技術(shù)的隱私保護(hù)方案,對用戶隱私進(jìn)行了量化。在考慮用戶意圖不同時每個個體不同的搜索行為,研究者設(shè)計了一個通用性工具,對基于混淆技術(shù)的隱私保護(hù)方案進(jìn)行隱私度量。

在位置服務(wù)領(lǐng)域,有研究人員提出關(guān)于位置隱私保護(hù)機制的框架。該框架利用確定攻擊模型以及敵手的背景知識,通過信息熵等方法來描述攻擊過程的精確性、確定性、正確性,從而實現(xiàn)隱私保護(hù)效果的度量。在云計算領(lǐng)域,為了保護(hù)云端的數(shù)據(jù)隱私,有研究人員提出了一種基于單個關(guān)鍵字的可搜索加密方案,適用于多個數(shù)據(jù)所有者上傳數(shù)據(jù)、多個用戶訪問數(shù)據(jù)的應(yīng)用。

然而,上述各類隱私度量方案缺乏對隱私概念的統(tǒng)一定義;其次,隱私度量隨信息接收主體、擁有數(shù)據(jù)量大小以及場景動態(tài)變化,目前缺乏隱私的動態(tài)度量方法;第三,信息跨系統(tǒng)傳播,缺乏不同系統(tǒng)隱私度量的一致性、隱私信息操作控制的形式化描述方法,不能支持跨平臺的隱私信息交換、延伸授權(quán)等動態(tài)保護(hù)需求。

綜上所述,現(xiàn)有的隱私保護(hù)以及隱私度量方案零散孤立,還缺乏隱私信息操作審計和約束條件的形式化描述方法。

尚未有將隱私保護(hù)與隱私侵犯取證追蹤一體化考慮的方案,因此目前無法構(gòu)建涵蓋信息采集、存儲、處理、發(fā)布(含交換)、銷毀等全生命周期各個環(huán)節(jié)的隱私保護(hù)和隱私侵犯取證追蹤的技術(shù)體系。而隱私計算的誕生則突破了現(xiàn)有隱私保護(hù)的局限,成了數(shù)字時代下隱私保護(hù)的風(fēng)口。

隱私計算離我們并不遙遠(yuǎn)

隱私作為一種敏感信息,是大數(shù)據(jù)的重要組成部分,隱私保護(hù)則關(guān)乎個人、企業(yè)乃至國家利益。但是,含有隱私的信息會在網(wǎng)絡(luò)中傳播、在各類信息服務(wù)系統(tǒng)中存儲、處理(編輯、融合、發(fā)布和轉(zhuǎn)發(fā))。

隱私計算是面向隱私信息全生命周期保護(hù)的計算理論和方法,具體是指在處理視頻、音頻、圖像、圖形、文字、數(shù)值、泛在網(wǎng)絡(luò)行為信息流等信息時,對所涉及的隱私信息進(jìn)行描述、度量、評價和融合等操作,形成一套符號化、公式化且具有量化評價標(biāo)準(zhǔn)的隱私計算理論、算法及應(yīng)用技術(shù),支持多系統(tǒng)融合的隱私信息保護(hù)。

隱私計算涵蓋了信息所有者、搜集者、發(fā)布者和使用者在信息采集、存儲、處理、發(fā)布(含交換)、銷毀等全生命周期過程的所有計算操作,是隱私信息的所有權(quán)、管理權(quán)和使用權(quán)分離時隱私描述、度量、保護(hù)、效果評估、延伸控制、隱私泄漏收益損失比、隱私分析復(fù)雜性等方面的可計算模型與公理化系統(tǒng)。

從技術(shù)理論來看,隱私計算主要分為三大技術(shù)路線,即密碼學(xué)、可信執(zhí)行環(huán)境、聯(lián)邦學(xué)習(xí)。其中,密碼學(xué)是以安全多方計算(Secure Multi-party Computation)、同態(tài)加密(Homomorphic Encryption)、零知識證明(Zero-knowledge Proof)等代表的隱私計算技術(shù)。

可信執(zhí)行環(huán)境(TEE)通過硬件技術(shù)來對數(shù)據(jù)進(jìn)行隔離保護(hù),將數(shù)據(jù)分類處理。支持TEE的CPU中,會有一個特定的區(qū)域,該區(qū)域的作用是給數(shù)據(jù)和代碼的執(zhí)行提供一個更安全的空間,并保證它們的機密性和完整性。

聯(lián)邦學(xué)習(xí)則是近些年新崛起的新興人工智能技術(shù),在2016年由谷歌最先提出,其設(shè)計目標(biāo)是在保障大數(shù)據(jù)交換時的信息安全、保護(hù)終端數(shù)據(jù)和個人數(shù)據(jù)隱私、保證合法合規(guī)的前提下,在多個參與方或多個計算節(jié)點之間開展高效率的機器學(xué)習(xí)。

不可否認(rèn)的是,隱私計算技術(shù)路線雖有差異,但密碼學(xué)對于隱私計算的影響依舊舉足輕重,密碼學(xué)理論研究成果也影響著隱私計算技術(shù)的進(jìn)展。

由于隱私計算不泄露原始數(shù)據(jù),因此可以在保護(hù)數(shù)據(jù)安全的前提下,實現(xiàn)多個維度數(shù)據(jù)的跨界融合。這將有助于破解數(shù)據(jù)保護(hù)與利用之間的矛盾的優(yōu)勢,也越來越受到市場的關(guān)注。Gartner發(fā)布的2019年技術(shù)炒作周期(hype cycle)曲線報告中,就首次將隱私計算列為處于啟動期的關(guān)鍵技術(shù)。

隱私計算離我們的生活并不遙遠(yuǎn)。

2016年,蘋果公司在全球開發(fā)者大會上首次提出了差分隱私技術(shù)(Differential Privacy)。從iOS 10開始,蘋果使用差分隱私技術(shù),在個人使用模式的小樣本中注入數(shù)學(xué)噪音。在不影響個人隱私的前提下,幫助發(fā)現(xiàn)大批量用戶的使用模式,從而增強用戶體驗。

從2018年開始,國內(nèi)的大型科技公司接連入局,資本市場也保持高度關(guān)注。這條賽道常常被認(rèn)為蘊藏著新的平臺型機會——在滿足數(shù)據(jù)合規(guī)的基礎(chǔ)之上,誰能率先實現(xiàn)數(shù)據(jù)源的有效融合,幫助需求方高效地提取可用數(shù)據(jù),進(jìn)而釋放數(shù)據(jù)價值,誰就有成為大平臺的機會。

此外,2016年底,工信部發(fā)布的《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》提出,支持企業(yè)加強多方安全計算等數(shù)據(jù)流通關(guān)鍵技術(shù)的攻關(guān)和測試驗證。2019年9月,工信部發(fā)布《工業(yè)大數(shù)據(jù)發(fā)展指導(dǎo)意見(征求意見稿)》,提出在工業(yè)領(lǐng)域積極推廣隱私計算技術(shù)以促進(jìn)工業(yè)數(shù)據(jù)安全流通。這也足以見得隱私計算的潛力之大。

數(shù)字價值釋放的突破口

當(dāng)然,由于隱私計算技術(shù)發(fā)展仍不完善,因此也面臨著一些問題。

一是隱私計算技術(shù)性能還難以滿足大規(guī)模商用要求。雖然目前隱私計算的性能已經(jīng)大大提升,但由于其加密機理復(fù)雜、交互次數(shù)多,當(dāng)流通的數(shù)據(jù)量較大或結(jié)構(gòu)較為復(fù)雜時,計算效率問題仍然未能解決。

其中,在隱私信息的生命周期中,受益于密碼學(xué)發(fā)展,隱私的加密化、匿名化和脫敏技術(shù)都已經(jīng)非常成熟,可以大規(guī)模應(yīng)用在隱私獲取、儲存、流轉(zhuǎn)等環(huán)節(jié)中。但大數(shù)據(jù)時代的到來,讓隱私數(shù)據(jù)的處理成為了一個難題:大規(guī)模的加密數(shù)據(jù)處理一定會導(dǎo)致計算性能下降,而非加密數(shù)據(jù)處理又極大概率會導(dǎo)致隱私信息的泄露。

二是隱私計算技術(shù)市場難以迅速培育。相對于其巨大的市場前景,目前隱私計算技術(shù)的市場還遠(yuǎn)未成熟,市場環(huán)境的培育也具有較大的難度。一方面,由于隱私計算技術(shù)復(fù)雜且常常呈現(xiàn)“黑盒化”現(xiàn)象,大部分用戶對隱私技術(shù)難以理解和信任。另一方面,隱私計算處理的對象往往是敏感的數(shù)據(jù)資產(chǎn),試錯成本大,從而更加增加了用戶的接受成本。

三是現(xiàn)有法律法規(guī)未對隱私計算地位進(jìn)行明確定位。由于隱私計算僅僅避免了原始數(shù)據(jù)轉(zhuǎn)移的過程,但仍然完成了基于多方數(shù)據(jù)的計算,使得其在某種程度上依然破壞了消費者的隱私。這也成為了制約隱私計算發(fā)展的無法回避的問題。

但顯然,這些技術(shù)的困境在時間的加持下終將被解決。事實上,數(shù)據(jù)隱私是進(jìn)入數(shù)字社會最先需要解決的問題。隱私計算技術(shù)在當(dāng)下恰逢其會而且前景深遠(yuǎn),將為數(shù)據(jù)隱私保駕護(hù)航并創(chuàng)造一種全新的“數(shù)據(jù)交易”龐大市場,也會成為實現(xiàn)數(shù)據(jù)價值釋放的突破口。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-09-07
隱私數(shù)據(jù)不再安全,隱私計算站上隱私保護(hù)的“風(fēng)口”
文/陳根隨著云計算、物聯(lián)網(wǎng)與大數(shù)據(jù)等技術(shù)的不斷發(fā)展,信息系統(tǒng)服務(wù)中針對用戶數(shù)據(jù)的收集整理、分析預(yù)測手段不斷成熟。

長按掃碼 閱讀全文