被人類“帶壞”?人工智能已出現(xiàn)種族和性別偏見

導(dǎo)語:英國媒體《衛(wèi)報》今日發(fā)表評論文章指出,人工智能已經(jīng)開始出現(xiàn)了種族和性別偏見,但是這種偏見并非來自機器本身,而是計算機在學(xué)習(xí)人類語言時吸收了人類文化中根深蒂固的觀念??茖W(xué)家呼吁,應(yīng)當(dāng)建立一個監(jiān)管機構(gòu),去糾正機器的這種行為。

以下是文章主要內(nèi)容:

讓計算機具備理解人類語言的人工智能(AI)工具已經(jīng)出現(xiàn)了明顯的種族和性別偏見。

這些發(fā)現(xiàn)令人擔(dān)憂現(xiàn)有的社會不平等和偏見正在以新的、不可預(yù)知的方式得到強化,因為影響人們?nèi)粘I畹拇罅繘Q策正越來越多地由機器人做出。

在過去的幾年里,谷歌翻譯等程序的語言翻譯能力有了顯著提高。這些成就要得益于新的機器學(xué)習(xí)技術(shù)和大量在線文本數(shù)據(jù)的使用,并在此基礎(chǔ)上對算法進(jìn)行訓(xùn)練。

然而,最新研究顯示,隨著機器越來越接近于掌握人類的語言能力,它們也在吸收隱藏于語言中的根深蒂固的偏見。

巴斯大學(xué)的計算機科學(xué)家、論文合著者喬安娜·布萊森(Joanna Bryson)說:“很多人都認(rèn)為這表明人工智能(AI)存在偏見。不,這表明我們有偏見,人工智能正在有樣學(xué)樣。”

但布萊森警告說,人工智能有可能強化現(xiàn)有偏見,因為算法與人類不同,可能無法有意識地抵制學(xué)到的偏見。“危險在于,你擁有的人工智能系統(tǒng)沒有一處零部件明確需要依靠道德觀念驅(qū)動,這就不好了,”她說。

微軟去年推出的Twitter機器人因不當(dāng)言論而緊急下線微軟去年推出的Twitter機器人因不當(dāng)言論而緊急下線

上述研究發(fā)表在《科學(xué)》雜志上,重點關(guān)注一種名為“單詞嵌入”機器學(xué)習(xí)工具,后者已經(jīng)改變了計算機解讀語音和文本的方式。有人認(rèn)為,下一步科技發(fā)展將自然而然地涉及到開發(fā)機器的類人化能力,如常識和邏輯。

“我們選擇研究單詞嵌入的一個主要原因是,近幾年來,它們已幫助電腦在破解語言方面取得了巨大成功,”這篇論文的資深作者、普林斯頓大學(xué)計算機科學(xué)家阿爾文德·納拉亞南(Arvind Narayanan)說。

這種方法已經(jīng)在網(wǎng)絡(luò)搜索和機器翻譯中使用,其原理是建立一套語言的數(shù)學(xué)表示式,依據(jù)與每個單詞同時出現(xiàn)的最常用單詞,將這個詞的意思提煉成一系列數(shù)字(也就是詞向量)。也許令人驚訝的是,這種純粹的統(tǒng)計方法似乎能夠捕捉到每個詞所在的豐富的文化和社會背景,這是字典無法定義的。

例如,在數(shù)學(xué)“語言空間”,與花朵有關(guān)的詞匯往往與描繪心情愉悅的話語聚集在一起,而與昆蟲相關(guān)的詞匯則往往與心情不愉快的詞匯同時出現(xiàn),反映出人們對昆蟲與花朵的相對特點所達(dá)成的共識。

最新的文件顯示,人類心理實驗中一些更令人不安的隱性偏見也很容易被算法捕獲。“雌性”和“女性”與藝術(shù)、人文職業(yè)和家庭的聯(lián)系更緊密,“雄性”和“男性”與數(shù)學(xué)和工程專業(yè)更為接近。

而且,人工智能系統(tǒng)更有可能將歐美人的名字與諸如“禮物”或“快樂”之類的愉快詞語聯(lián)系在一起,而非裔美國人的名字通常與不愉快的詞語聯(lián)系在一起。

研究結(jié)果表明,算法與隱式聯(lián)想測試擁有同樣的偏見,也就是把表示愉快的單詞與(美國和英國的)白人面孔聯(lián)系起來。

這些偏見會對人類行為產(chǎn)生深遠(yuǎn)的影響。一項先前的研究表明,相對于非洲裔美國人,如果申請者的名字是歐洲裔美國人,即使簡歷內(nèi)容相同,后者所能獲得的面試邀請將比前者多出50%。最新的研究結(jié)果表明,除非采用明確的編程來解決這個問題,否則,算法將與現(xiàn)實社會一樣,充斥著相同的社會偏見。

“如果你不相信種族主義與姓名存在聯(lián)系,這就是例證,”布萊森說。

研究中使用的機器學(xué)習(xí)工具是在被稱為“通用爬蟲”語料庫的訓(xùn)練數(shù)據(jù)集中接受訓(xùn)練的,其中的8400億個詞語都是從網(wǎng)上公布的材料中選取的。當(dāng)研究人員把訓(xùn)練數(shù)據(jù)集換成谷歌新聞的數(shù)據(jù)對機器學(xué)習(xí)進(jìn)行訓(xùn)練時,也出現(xiàn)了類似結(jié)果。

牛津大學(xué)數(shù)據(jù)倫理和算法領(lǐng)域的研究人員桑德拉·沃徹(Sandra Wachter)說:“世界存在偏見,歷史數(shù)據(jù)存在偏見,因此,我們得到帶有偏見的結(jié)果,不足為奇。”

她補充說,算法不僅代表一種威脅,也可能為采取適當(dāng)方式解除和對抗偏見提供機會。

“至少利用算法,我們可能知道算法會在什么時候出現(xiàn)偏差,”她說。例如,人類會在解釋為何不雇傭某人時說謊,與此相反,算法不會撒謊,不會欺騙我們。”

然而,沃徹說,問題在于如何從旨在理解語言的算法中消除不恰當(dāng)?shù)钠?,同時又不剝奪它們的解讀能力,這將是具有挑戰(zhàn)性的工作。

“原則上,我們可以建立一些系統(tǒng)對帶有偏見的決定進(jìn)行檢測,然后采取行動,”沃徹說,并與其他人一起呼吁建立一個人工智能監(jiān)管機構(gòu)。“這是一項非常復(fù)雜的任務(wù),但作為一種社會責(zé)任,我們不應(yīng)回避。”(斯眉)

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-04-14
被人類“帶壞”?人工智能已出現(xiàn)種族和性別偏見
英國媒體《衛(wèi)報》今日發(fā)表評論文章指出,人工智能已經(jīng)開始出現(xiàn)了種族和性別偏見,但是這種偏見并非來自機器本身,而是計算機在學(xué)習(xí)人類語言時吸收了人類文化中根深蒂固的

長按掃碼 閱讀全文