在談?wù)摗叭四樧R別”的時候,我們指的是什么?
當下,絕大多數(shù)互聯(lián)網(wǎng)用戶的數(shù)據(jù)正在被搜集,但基本上是識別型編碼,比如瀏覽器cookies或者電郵地址。代表我們在線身份的一切最終都可以轉(zhuǎn)化為一堆數(shù)字和字母,這里面幾乎所有的信息都可以被改變,就好像你隨時可以申請一個新的社保號碼一樣。而臉部數(shù)據(jù)則完全不同,臉部識別數(shù)據(jù)和公眾用戶的其他生物數(shù)據(jù)一樣,改變成本非常高,有時候甚至是不可能的。從某種意義上說,臉部數(shù)據(jù)是一種我們所有人無法逃脫的“數(shù)據(jù)鏈路”。
臉部識別技術(shù)有許多種。第一種是最初級的,也被稱之為臉部探測,通常用在手機攝像頭上,在拍照時對臉部自動對焦。第二種是臉部分類(facial characterization),分辨臉部肌理,但是能夠判斷的信息也很有限。其他的臉部識別技術(shù)則有著更復(fù)雜的使用場景。比如一些軟件使用臉部識別技術(shù)進行用戶身份核實,在攝像頭捕捉到確認畫面時激活電腦或是手機。最令公眾產(chǎn)生警覺的,是用來探測未知用戶身份的臉部識別功能——也就是將數(shù)據(jù)庫中的人臉數(shù)據(jù)和身份數(shù)據(jù)匹配。
這并非危言聳聽:去年夏天,F(xiàn)acebook的人工智能團隊宣布,其人臉識別軟件產(chǎn)品達到了近人類等級的精確度標準。就在上周,F(xiàn)acebook展示了一項更先進的成果:通過使用另一套不同的算法,通過分析目標的發(fā)型、身姿和體態(tài),在沒有出現(xiàn)臉部圖像的情況下,也能達到83%的識別準確率。
這種臉部識別的應(yīng)用場景才是人們最擔心的,這一點我們在下文討論。
臉部識別的應(yīng)用場景分兩種:一個是在線上,虛擬世界,比如電腦通過你上傳的用戶圖像識別你的身份;另一個是線下,真實世界,比如系統(tǒng)通過你在街上被監(jiān)視器拍到照片來識別你的身份。隱私專家們之間達成的共識是,目前企業(yè)界在線上使用臉部識別技術(shù)的能力大大超越了在線下使用這項技術(shù)的水平。比如上文提到Facebook的新技術(shù),就專門用于在線圖片的分析,能夠在97.25%的識別中準確判斷不同照片中是否出現(xiàn)的是一個人,而人類在同樣的測試中正確率也只有97.5%。線下方面,盡管科技公司們聲稱臉部識別技術(shù)也有成功案例,但實際情況卻并非如此。
不過這種線上和線下的界限并不是很明顯。2014年來自卡耐基梅隆大學(xué)的一位教授通過試驗發(fā)現(xiàn),對校園內(nèi)的行人進行拍照并且比對Facebook用戶頭像,有三分之一的人能夠被臉部識別技術(shù)探測出來。不僅如此,他還成功地使用算法對這部分人群的興趣甚至社保號碼進行了預(yù)測。換句話說,在線下,已經(jīng)有人實現(xiàn)33%的臉部識別準確率。
分歧:用戶是否需要事先對臉部識別進行授權(quán)?
2014 年,美國商務(wù)部組織了一次會議,邀請各方代表探討如何監(jiān)管臉部識別技術(shù),出席會議的有美國政府負責制定科技政策的部門,還有來自消費者隱私保護組織和科技產(chǎn)業(yè)的代表。雖然這個會議仍舊在舉辦,但需要指出的是,消費者保護組織已經(jīng)不在了。美國消費者聯(lián)盟和用戶隱私保護團體EFF今年六月宣布退出,他們表示,科技行業(yè)的公司和說客們,堅決不承認用戶需要事先對臉部識別軟件進行授權(quán)的權(quán)利,所以繼續(xù)參加此次會議,已經(jīng)毫無意義。
“假設(shè)現(xiàn)在有一個人在大街上走,與這個人沒有關(guān)系的一個組織,如果想要識別他的身份,難道不應(yīng)該首先獲取他的同意嗎?”喬治城大學(xué)隱私和科技中心(Georgetown Center on Privacy and Technology)執(zhí)行總監(jiān)阿瓦羅(Alvaro Bedoya)一針見血地指出。阿瓦羅是本次會議中消費者隱私保護一方的意見領(lǐng)袖,他提出的問題也是消費者保護團體退出會議的根本原因。他還表示,科技行業(yè)不愿意承認用戶要對技術(shù)行為進行事先授權(quán)。
政府機構(gòu)發(fā)言人對筆者表示,對于會議分崩離析“很失望”。代表科技行業(yè)參會的某科技公司高管則表示,他認為在許多情況下用戶授權(quán)是不需要的。
就目前的實際情況來看,科技公司之間對于用戶是否應(yīng)該在被臉部識別之前對系統(tǒng)進行授權(quán)這一點,也存在分歧。Facebook的新App應(yīng)用需要用戶額外操作,才能避免被掃描進入臉部數(shù)據(jù),這意味著其默認是允許的。而微軟公司則向筆者表示,他們在對用戶進行臉部掃描之前,會要求用戶給出授權(quán)許可。而Google表示在消費者照片產(chǎn)品上完全不使用臉部識別技術(shù),而是做“臉部數(shù)據(jù)簇”(face clustering),也就是在手機或電腦的本地將類似的臉部圖像進行分組。用戶也可以關(guān)掉這一功能。2013年該公司迫于壓力禁止在Google Glass上發(fā)布臉部識別App應(yīng)用。
誰會擁有我們的“臉”?
從公開報道來看,消費者隱私保護組織和科技行業(yè)代表的分歧,是用戶授權(quán)。那么臉部識別軟件的政府監(jiān)管,將如何進行?在臉部識別技術(shù)準確率非常之高的情況下,究竟是誰在掌握著我們的臉部數(shù)據(jù)?
那么政府又在其中扮演著怎樣的角色?目前美國政府的臉部識別數(shù)據(jù)庫已經(jīng)有 5200萬條數(shù)據(jù),占全美人口的三分之一。盡管這個數(shù)字已經(jīng)很龐大,但是仍舊落后于公司收集的用戶臉部數(shù)據(jù)。
用戶隱私保護團體 EFF 在退出大會的聲明中,提出了商業(yè)資源和政府資源的合作問題:“幾年前,在一次信息自由法案(FOIA)主張的調(diào)閱中,我們發(fā)現(xiàn)美國聯(lián)邦機構(gòu)對社交媒體公司(如 Facebook)發(fā)布的搜查令包括用戶上傳的所有圖片,也包括用戶被標簽的其他人上傳的圖片。未來我們將會看到政府機構(gòu)試圖獲取用戶臉部識別數(shù)據(jù)的情況。”