數(shù)據(jù)安全共享需要自律與他律,更需要創(chuàng)新技術(shù)
《通用數(shù)據(jù)保護條例》(GDPR)下的歐洲再現(xiàn)數(shù)據(jù)泄露大事件。11月3日,瑞典最大的保險公司Folksam證實,近100萬客戶的個人信息已泄露給Facebook和Google等社交媒體,泄露信息包括敏感個人數(shù)據(jù)如個人社會保險賬號等。
大數(shù)據(jù)與人工智能時代背景下,數(shù)據(jù)在各行各業(yè)應(yīng)用越廣泛,數(shù)據(jù)價值就愈加凸顯,數(shù)據(jù)泄露和濫用造成的影響和損失也越大。
新加坡國立大學(xué)副教授何丙勝表示,數(shù)據(jù)泄露已非孤立事件,各行業(yè)都有相關(guān)事件。在教育、醫(yī)藥、能源、健康等領(lǐng)域,每一起數(shù)據(jù)泄露事件造成的平均損失至少在500萬美元以上。
矛盾之處在于,數(shù)據(jù)唯有流動和共享才能發(fā)揮價值,但反復(fù)出現(xiàn)的數(shù)據(jù)泄露事件不僅造成了巨大的經(jīng)濟損失,更消耗了整個社會對數(shù)據(jù)共享的意愿和信心。數(shù)據(jù)的安全流動與共享似乎成為一個偽命題。
傳統(tǒng)觀點認為,數(shù)據(jù)保護與共享需要依靠“自律” 及“他律”,即自身防護和制度保障,可謂“被動防守”。而近年來,隨著隱私計算技術(shù)的出現(xiàn),數(shù)據(jù)共享即將告別瞻前顧后的窘境,引領(lǐng)“主動出擊”新趨勢。
簡單來說,隱私計算就是通過技術(shù)實現(xiàn)數(shù)據(jù)“可用不可見”,讓不同來源的數(shù)據(jù)安全共享,產(chǎn)生更大價值,具體包括了如TEE(基于芯片的可信計算環(huán)境)、基于密碼學(xué)的安全多方計算(MPC)、源自人工智能的聯(lián)邦學(xué)習等在內(nèi)的各類技術(shù)的單項或綜合使用。
從產(chǎn)業(yè)視角來看,隱私計算已成為當下創(chuàng)投圈的熱點話題,國內(nèi)外眾多互聯(lián)網(wǎng)及科技巨頭紛紛投身該賽道,一批創(chuàng)業(yè)企業(yè)也各有所長,顯示出了強勁實力。
盡管隱私計算行業(yè)尚處早期,相關(guān)技術(shù)尚未成熟,但并不意味著隱私計算只是“飄在空中”的美好理想??v觀全球,隱私計算已經(jīng)在人工智能、金融、醫(yī)療等許多場景中應(yīng)用落地。
谷歌Password Checkup ——世界巨頭旗下小而美的科普案例
2019 年2 月,谷歌推出密碼檢查器Password Checkup,一個Chrome擴展程序,幫助用戶檢測他們在網(wǎng)站上輸入的用戶名和密碼是否已被盜用。
Password Checkup依賴于隱私集合交集(PSI)的加密協(xié)議,收集了超過40 個億的已知不安全或已外泄的賬號和密碼,在Chrome 用戶安裝這功能后,一旦用戶登錄某個網(wǎng)站時,Google 便會主動偵測帳戶密碼是否在外泄名單中。
該功能支持全美“大多數(shù)”站點,如果被撞到,會及時向用戶發(fā)出警告。值得注意的是,Password Checkup 會自動讀取保存在谷歌瀏覽器中的表單的帳號和密碼,然后采用哈希加密數(shù)據(jù)后發(fā)送到谷歌服務(wù)器再對比。
谷歌鑒于密碼檢查依賴于機密的信息,強調(diào)所有的加密都是在本地完成的,確保無人能查詢用戶密碼,數(shù)據(jù)庫中的密碼以散列和加密的形式存儲,且生成的有關(guān)的任何警告,所以用戶也不需要擔心在密碼傳輸過程中出現(xiàn)意外泄露引起問題等。
谷歌Password Checkup的原理
圖片來源:谷歌官網(wǎng)
Password Checkup程序體積小巧,功能簡單,但背后卻對大量數(shù)據(jù)進行高安全等級處理。本地加密、密文數(shù)據(jù)對比等可以說是隱私計算基本概念的教科書式展現(xiàn),也令其成為數(shù)據(jù)安全共享的典型科普案例。
iOS基于差分隱私技術(shù)"把隱私鎖在本地"——在手中的隱私計算
移動互聯(lián)網(wǎng)時代,手機里幾乎承載了一個人收集所有的秘密。舉例來說,如果一個被移除ID類信息的數(shù)據(jù)集發(fā)布,從法律和倫理來說這個數(shù)據(jù)集因為沒有涉及個人隱私,因此是合法合規(guī)的。但是如果通過一些技術(shù)手段,利用不同數(shù)據(jù)集、公開信息之間的關(guān)聯(lián)性,可以推測出某個具體個人信息的時候,問題就出現(xiàn)了。早在2013年一位當時就讀于美國西北大學(xué)的研究生,結(jié)合搜索引擎與紐約城市出租車和豪華轎車委員會對外公布的一份2013年全市的出租車行程數(shù)據(jù),便鎖定了幾位明星的行蹤,證實了這一風險。
由此可得,僅僅移除數(shù)據(jù)中的ID這類信息是不足以保護隱私的。但要如何抵御上述情況中對于個體用戶隱私數(shù)據(jù)的“精確計算”問題,而又能提高數(shù)據(jù)共享和使用的效率?
比如始終堅持選擇成為用戶數(shù)據(jù)守衛(wèi)者的蘋果公司,當其他公司都在通過各類方式采集用戶數(shù)據(jù)的時候,蘋果對此說了“NO”。但事實是,在一番努力后,iOS中仍有幾個矛盾未解。比如蘋果需要通過用戶行為數(shù)據(jù)來對特定功能進行精準調(diào)整,以滿足其智能服務(wù)。差分隱私技術(shù)便是破解這一問題的答案。跟隨iOS 10的推出,蘋果就已經(jīng)開始使用差分隱私來收集并分析來自鍵盤、Spotlight和Notes的用戶數(shù)據(jù)。
差分隱私的原理是用算法加擾個人用戶數(shù)據(jù),使上述的技術(shù)回溯過程無法實現(xiàn)。隨后在無法獲得原始數(shù)據(jù)的情況下對數(shù)據(jù)批量計算,輸出計算結(jié)果。在獲得機器學(xué)習所需的數(shù)據(jù)資源的同時,實現(xiàn)用戶隱私數(shù)據(jù)的保護。
而iOS 10采取的是本地化差分隱私算法對用戶數(shù)據(jù)進行計算。即對單個用戶數(shù)據(jù)進行隨機化處理,再將設(shè)備數(shù)據(jù)集體發(fā)送給蘋果公司。蘋果公司也不會收集用戶鍵入的每一個單詞或搜索關(guān)鍵字。這樣一來能夠有效消除蘋果公司泄露數(shù)據(jù)的安全隱患,也減少了數(shù)據(jù)在傳輸過程中如因發(fā)生泄露而導(dǎo)致的不可逆轉(zhuǎn)后果。
在2016年開始使用差分隱私技術(shù)的不止蘋果公司,還有谷歌(RAPPOR系統(tǒng))。而當時差分隱私領(lǐng)域的權(quán)威人士,著有《差分隱私的算法基礎(chǔ)》一書的賓夕法尼亞大學(xué)教授Aaron Roth當收到蘋果遞交給他評審的差分隱私執(zhí)行文件后,這位教授使用“開創(chuàng)性”一詞評價了蘋果在差分隱私方面的工作。
微眾銀行FATE平臺 —— 人工智能時代聯(lián)邦學(xué)習助力數(shù)據(jù)安全共享
人工智能的發(fā)展構(gòu)筑于數(shù)據(jù)之上,卻也受限于數(shù)據(jù)利用的瓶頸。一方面許多場景并沒有足夠數(shù)量的大數(shù)據(jù),另一方面即使有大數(shù)據(jù),這些數(shù)據(jù)也可能相互孤立,無法交流共享。尤其在相關(guān)法規(guī)(如GDPR)不斷趨嚴,各行業(yè)數(shù)據(jù)安全意識不斷提升的背景下,數(shù)據(jù)的安全流動與共享對機器學(xué)習乃至人工智能的發(fā)展帶來了挑戰(zhàn)。
于是,聯(lián)邦學(xué)習應(yīng)運而生,成為人工智能“量身定制”的隱私計算解決方案。聯(lián)邦學(xué)習是一種加密的分布式機器學(xué)習技術(shù),參與各方可以在不披露底層數(shù)據(jù)的前提,按照底層數(shù)據(jù)加密(混淆)形態(tài)下共建模型。
聯(lián)邦學(xué)習具有四大顯著優(yōu)勢:一是數(shù)據(jù)隔離,二是保證模型質(zhì)量無損,三是參與者地位對等,最后則是能夠保證參與各方在保持獨立性的情況下,進行信息與模型參數(shù)的加密交換,并同時獲得成長。
在國內(nèi),微眾銀行可以說是聯(lián)邦學(xué)習領(lǐng)域的領(lǐng)頭羊。早在2018年末,電氣和電子工程師協(xié)會標準委員會(IEEE Standard Association)就批準了由微眾銀行發(fā)起的關(guān)于聯(lián)邦學(xué)習架構(gòu)和應(yīng)用規(guī)范的標準P3652.1立項。微眾銀行成為工作組召集單位,工作組主席則是微眾銀行首席人工智能官,國際人工智能學(xué)會理事長楊強教授。
在2019年初舉行的AAAI(Association for the Advancement of Artificial Intelligence)年會上,微眾銀行AI團隊正式發(fā)布了聯(lián)盟AI生態(tài)系統(tǒng)(Federated AI Ecosystem)和開源聯(lián)盟AI解決方案FATE(Federated AI Technology Enabler)。
FATE提供了一個安全的計算框架來支持聯(lián)邦學(xué)習需求。它實現(xiàn)了基于同態(tài)加密和多方計算(MPC)的安全計算協(xié)議,同時支持聯(lián)合學(xué)習體系結(jié)構(gòu)和各種機器學(xué)習算法(包括邏輯回歸,基于樹型算法,深度學(xué)習和遷移學(xué)習)的安全計算。
作為聯(lián)邦學(xué)習領(lǐng)域第一個商用級開源項目,F(xiàn)ATE為開發(fā)者提供所必須的多方協(xié)同建模工作流管理、加密機器學(xué)習工具庫和并行計算基礎(chǔ)設(shè)施抽象三層能力,同時提供了很多開箱即用的聯(lián)邦學(xué)習算法和聯(lián)邦遷移學(xué)習算法供開發(fā)者參考,極大簡化了聯(lián)盟AI開發(fā)的流程并降低了部署難度。
幾乎同時,全國連鎖租車品牌一嗨租車與微眾銀行共同宣布達成深度戰(zhàn)略合作關(guān)系,宣布雙方將在汽車出行、會員服務(wù)、金融保險、區(qū)塊鏈技術(shù)等方面展開多場景多維度創(chuàng)新合作。一嗨租車使用聯(lián)邦遷移學(xué)習、AI人臉認證技術(shù)、支付技術(shù)等金融科技,以優(yōu)化提升用戶體驗為目的深度融入租車服務(wù)流程,并將租車場景與銀行大數(shù)據(jù)風險控制體系相結(jié)合,從而為年輕一族及長租客戶提供新的出行生活方式。
華控清交助力首都金融數(shù)據(jù)應(yīng)用運行新模式——創(chuàng)新團隊的創(chuàng)新案例
防范系統(tǒng)性金融風險首先要做到的就是能夠及時發(fā)現(xiàn)和準確甄別金融體系中的系統(tǒng)性風險。有效的監(jiān)管不光需要依賴金融監(jiān)管部門本身的數(shù)據(jù),還需要有效地利用各金融市場參與方的大量和實時的數(shù)據(jù),使監(jiān)管部門對金融行為和金融風險的畫像更完整、分析更準確、判斷更及時。但這些數(shù)據(jù)往往會涉及這些市場參與方的重要商業(yè)機密或客戶隱私。
華控清交基于多方安全計算并融合其他隱私計算技術(shù)提出的安全數(shù)據(jù)融合解決方案,能夠在不解密加密數(shù)據(jù)的情況下,直接以密文數(shù)據(jù)進行計算,從技術(shù)層面解決了數(shù)據(jù)隱私保護與數(shù)據(jù)高效流通對立的問題,使多個非互信金融數(shù)據(jù)源之間可以在數(shù)據(jù)全程加密的前提下進行高效的大數(shù)據(jù)融合和計算。
該方案獲評“首都金融創(chuàng)新激勵項目”,解決了“確保首都金融科技高速發(fā)展與提升監(jiān)管水平、保障金融安全”之間的矛盾,開啟了首都金融數(shù)據(jù)應(yīng)用的新運行模式。
華控清交PrivPy平臺架構(gòu)
圖片來源:華控清交官網(wǎng)
華控清交主打多方安全計算,其PrivPy平臺是一個實現(xiàn)了高性能通用的安全計算框架、集群化和可擴展的解決方案,是各類技術(shù)路徑融合的創(chuàng)新典型,在市場層面也代表了國內(nèi)創(chuàng)業(yè)企業(yè)的不俗實力。
翼方健數(shù)廈門“健康醫(yī)療數(shù)據(jù)應(yīng)用開放平臺”—— 首個城市級應(yīng)用案例
翼方健數(shù)基于城市級醫(yī)療數(shù)據(jù)底座,為國家醫(yī)療健康大數(shù)據(jù)首批試點城市廈門構(gòu)建了基于隱私安全計算技術(shù)的 “健康醫(yī)療數(shù)據(jù)應(yīng)用開放平臺”,在保證數(shù)據(jù)隱私的前提下,通過開放平臺提高數(shù)據(jù)使用效率,打破數(shù)據(jù)孤島,構(gòu)建了一個醫(yī)療數(shù)據(jù)應(yīng)用開放的數(shù)據(jù)生態(tài)。翼方健數(shù)協(xié)助廈門實現(xiàn)醫(yī)療數(shù)據(jù)戰(zhàn)略從頂層設(shè)計到底層實現(xiàn)的“落地”,為廈門醫(yī)療大數(shù)據(jù)的科研協(xié)作分析以及精準醫(yī)學(xué)的發(fā)展提供了有力的基礎(chǔ)設(shè)施保障,是目前所知首個利用隱私計算技術(shù)實現(xiàn)城市級數(shù)字化應(yīng)用的案例。
翼方健數(shù)所構(gòu)建的XDP翼數(shù)坊是一個以開放應(yīng)用平臺形式實現(xiàn)的數(shù)據(jù)生態(tài)系統(tǒng)。平臺為用戶提供完善的數(shù)據(jù)安全保護機制,為第三方應(yīng)用程序提供友好的計算和開發(fā)環(huán)境,以及為數(shù)據(jù)生態(tài)中各方設(shè)計價值分配機制,可以完全滿足對數(shù)據(jù)共享和協(xié)作的要求。
平臺面向生態(tài)中的不同角色,滿足各方數(shù)據(jù)服務(wù)訴求。例如,數(shù)據(jù)提供方的訴求包括數(shù)據(jù)存儲、數(shù)據(jù)安全、數(shù)據(jù)脫敏、數(shù)權(quán)保護、數(shù)據(jù)價值生成等;數(shù)據(jù)服務(wù)方的訴求包括開發(fā)環(huán)境和價值歸隱等;數(shù)據(jù)需求方的訴求包括高質(zhì)量數(shù)據(jù)服務(wù),如數(shù)據(jù)清洗、數(shù)據(jù)血緣、數(shù)據(jù)探查,其中包括了平臺在用戶數(shù)據(jù)探查和訪問控制的設(shè)計中貫徹數(shù)據(jù)的“最小可用原則”,進一步保證數(shù)據(jù)隱私。
目前,基于這套隱私安全計算平臺已成功推出智能分級診療的“廈門模式”,同時實現(xiàn)臨床科研協(xié)作以及傳染病防控等多項能力輸出。
翼方健數(shù)通過隱私安全計算技術(shù),確保數(shù)據(jù)不離開平臺,只輸出數(shù)據(jù)價值,來協(xié)助數(shù)據(jù)所有者“共享”自己的數(shù)據(jù)而又不用擔心數(shù)據(jù)被他人獲取,破局頑固的“信息孤島”,實實在在做到了以數(shù)據(jù)流通造福社會。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )