人工智能系統(tǒng)為何會(huì)產(chǎn)生幻覺(jué)?深入探究
如今,人工智能(AI)以虛擬助手、智能家居設(shè)備、醫(yī)療診斷和自動(dòng)駕駛汽車的形式運(yùn)行。然而,這項(xiàng)關(guān)鍵技術(shù)的發(fā)展也帶來(lái)了一個(gè)問(wèn)題,因?yàn)樗鼤?huì)導(dǎo)致所謂的“人工智能幻覺(jué)”。
人工智能系統(tǒng)為何會(huì)產(chǎn)生幻覺(jué)?簡(jiǎn)單來(lái)說(shuō),人工智能幻覺(jué)是指人工智能系統(tǒng)在訓(xùn)練數(shù)據(jù)收集過(guò)程中,產(chǎn)生或推斷不存在的不正確信息的情況。另一方面,如果無(wú)法解決人工智能幻覺(jué)問(wèn)題,則可能導(dǎo)致傳播虛假信息和做出有偏見(jiàn)的判斷等問(wèn)題,從而引發(fā)經(jīng)濟(jì)和安全問(wèn)題。本文將解釋人工智能系統(tǒng)為何會(huì)產(chǎn)生幻覺(jué)、其原因及預(yù)防措施。
當(dāng)大型語(yǔ)言模型能夠觀察到從未見(jiàn)過(guò)或根本不存在的特征或物體時(shí),AI系統(tǒng)很可能會(huì)出現(xiàn)幻覺(jué)。這會(huì)導(dǎo)致它生成不正確的輸出信息,這些信息在現(xiàn)實(shí)生活中毫無(wú)意義,但在某些情況下,它是基于自身感知到的模式/物體。
換言之,當(dāng)模型做出錯(cuò)誤陳述或依賴訓(xùn)練數(shù)據(jù)中的瑣碎模式和偏見(jiàn)來(lái)產(chǎn)生或捍衛(wèi)有爭(zhēng)議的答案時(shí),人工智能系統(tǒng)會(huì)產(chǎn)生幻覺(jué),但這種情況發(fā)生在更高復(fù)雜程度上。
人工智能幻覺(jué)的原因
人工智能系統(tǒng)產(chǎn)生幻覺(jué)有幾個(gè)主要原因:
數(shù)據(jù)偏見(jiàn):由于人工智能無(wú)法判斷所涉及的公平性或偏見(jiàn),大多數(shù)模型都會(huì)提出不完整或包含偏見(jiàn)/偏見(jiàn)元素的缺失數(shù)據(jù)和訓(xùn)練數(shù)據(jù)樣本。例如,曾經(jīng)有過(guò)面部識(shí)別算法無(wú)法識(shí)別非白人面孔的情況;這被歸因于基于這種偏見(jiàn)編制的訓(xùn)練數(shù)據(jù)集。
過(guò)度擬合:數(shù)據(jù)庫(kù)中的信息過(guò)多是人工智能系統(tǒng)產(chǎn)生幻覺(jué)的另一個(gè)原因。已識(shí)別的神經(jīng)網(wǎng)絡(luò)存在一些問(wèn)題,即在從這個(gè)有限數(shù)據(jù)集中的模式中學(xué)習(xí)時(shí),它們可能會(huì)“記住”或“過(guò)度擬合”過(guò)于嘈雜的模式。這反過(guò)來(lái)又使它們?cè)诮佑|到與訓(xùn)練中不同的輸入時(shí)更容易產(chǎn)生幻覺(jué)。 誤差積累:輸入數(shù)據(jù)中的小誤差或噪聲將在其分層處理形式中會(huì)被放大,例如,在具有數(shù)十億個(gè)參數(shù)的大型變壓器模型中,它可能導(dǎo)致產(chǎn)生失真甚至偽造的輸出。 反饋循環(huán):如果不加以糾正,幻覺(jué)問(wèn)題甚至?xí)谧晕冶O(jiān)督系統(tǒng)中加劇。例如,人工智能可以根據(jù)神經(jīng)網(wǎng)絡(luò)創(chuàng)建照片,而深度偽造可以讓另一個(gè)人工智能相信這些信息是真實(shí)的。人工智能幻覺(jué)可能帶來(lái)的危害
人工智能幻覺(jué)帶來(lái)了嚴(yán)峻的挑戰(zhàn);如果不加以解決,可能會(huì)出現(xiàn)以下情況:
虛假信息:缺乏真實(shí)性,再加上機(jī)器人人工智能的偽造性質(zhì),虛假統(tǒng)計(jì)數(shù)據(jù)和虛假信息可能會(huì)迅速傳播,并扭曲人們尋找可靠數(shù)據(jù)的能力。如果這些系統(tǒng)用于新聞、教育或公共政策制定領(lǐng)域,這在很大程度上令人擔(dān)憂。 隱私侵犯:如果將此類系統(tǒng)應(yīng)用于相應(yīng)的任務(wù),如醫(yī)療保健、執(zhí)法等,那么在產(chǎn)生幻覺(jué)的同時(shí),從未觀察到的個(gè)人敏感私人數(shù)據(jù)可能會(huì)嚴(yán)重侵犯隱私并削弱信任。 對(duì)邊緣群體的危害:如前所述,在人工智能數(shù)據(jù)集中,選擇偏見(jiàn)會(huì)歧視社會(huì)弱勢(shì)群體,并使社會(huì)正義成為一個(gè)更大的問(wèn)題。 安全隱患:幻覺(jué)人工智能對(duì)自動(dòng)駕駛汽車或醫(yī)療診斷設(shè)備上的說(shuō)明或指南存在錯(cuò)誤信息,這可能導(dǎo)致事故、傷害或錯(cuò)誤的醫(yī)療決策,因?yàn)榇祟惾斯ぶ悄芟到y(tǒng)依賴于不完善的信息。 經(jīng)濟(jì)成本:在多個(gè)設(shè)施和服務(wù)交付中使用幻覺(jué)人工智能缺乏創(chuàng)新和增長(zhǎng),可能會(huì)導(dǎo)致客戶信心喪失,以及相關(guān)組織和設(shè)施價(jià)值下降。為這些成本確定一個(gè)有形的數(shù)字并不太可能,因?yàn)槲:?shí)在是太大了,難以想象。防止人工智能幻覺(jué)
以下是研究人員為預(yù)防人工智能產(chǎn)生幻覺(jué)而采取的主動(dòng)措施:
廣泛且無(wú)偏見(jiàn)的數(shù)據(jù):收集不包含先入之見(jiàn)或偏袒社會(huì)某一階層的訓(xùn)練數(shù)據(jù)集,有助于AI更好地訓(xùn)練自身。公共數(shù)據(jù)庫(kù)需要進(jìn)行清理和事實(shí)核查,以防止虛假數(shù)據(jù)傳播。 數(shù)據(jù)預(yù)處理:去除異常觀察、數(shù)據(jù)匿名化、特征減少等措施,可能有助于在將數(shù)據(jù)輸入系統(tǒng)之前消除數(shù)據(jù)中的噪音和不必要的模式。 模型評(píng)估:人工智能系統(tǒng)應(yīng)該使用精心設(shè)計(jì)的新的評(píng)估數(shù)據(jù)集進(jìn)行不斷的檢查,以識(shí)別新的幻覺(jué)。 模型監(jiān)控:為了解釋人工智能不必要的反應(yīng),模型卡或數(shù)據(jù)聲明等機(jī)制可以使人們記錄人工智能在一段時(shí)間內(nèi)的行為。 可解釋的人工智能:使用像注意力地圖和SHAP值這樣的方法,人們可以理解為什么模型會(huì)產(chǎn)生這樣的反應(yīng),并根據(jù)與模式兼容的特征確定簡(jiǎn)單的分析。 保守部署:人工智能系統(tǒng)應(yīng)該局限于特定領(lǐng)域,在人類的監(jiān)督下進(jìn)行有限和可控的使用,直到人工智能被證明是安全、可靠的,并且在對(duì)待人類方面公平兩倍。為了幫助人工智能繼續(xù)為社會(huì)帶來(lái)利益,并防止出現(xiàn)幻覺(jué)相關(guān)損害的危險(xiǎn),組織應(yīng)提前面對(duì)數(shù)據(jù)和模型質(zhì)量問(wèn)題。謹(jǐn)慎負(fù)責(zé),避免人工智能助手幻覺(jué)和相關(guān)謬論可能帶來(lái)的嚴(yán)重后果。
總之,只要實(shí)施相應(yīng)的緩解策略,人工智能幻覺(jué)風(fēng)險(xiǎn)是可以控制的。然而,避免可能的負(fù)面結(jié)果需要技術(shù)開(kāi)發(fā)者和影響政策變化的人的持續(xù)觀察。只有在做出這樣的共同努力之后,才能開(kāi)發(fā)出一個(gè)對(duì)人類產(chǎn)生積極影響同時(shí)又能保證人類安全的人工智能系統(tǒng)。
常見(jiàn)問(wèn)題解答:
1、什么是人工智能幻覺(jué)?
答:人工智能幻覺(jué)是指人工智能系統(tǒng)生成虛假或無(wú)意義信息的情況,通常是由于對(duì)數(shù)據(jù)或模式的誤解造成的。
2、人工智能系統(tǒng)為何會(huì)產(chǎn)生幻覺(jué)?
答:人工智能系統(tǒng)可能會(huì)由于各種因素而產(chǎn)生幻覺(jué),包括過(guò)度擬合、訓(xùn)練數(shù)據(jù)中的偏見(jiàn)以及模型復(fù)雜度高。
3、人工智能幻覺(jué)有多常見(jiàn)?
答:幻覺(jué)在人工智能中相當(dāng)常見(jiàn),尤其是在缺乏對(duì)可能結(jié)果的約束的大型語(yǔ)言模型和生成工具中。
4、人工智能幻覺(jué)可以被預(yù)防嗎?
答:防止人工智能幻覺(jué)包括使用過(guò)濾工具為人工智能模型定義明確的邊界,并設(shè)置概率閾值。
5、人工智能幻覺(jué)會(huì)帶來(lái)什么后果?
答:其后果可能包括傳播錯(cuò)誤信息甚至造成現(xiàn)實(shí)世界的傷害,例如錯(cuò)誤的醫(yī)療診斷。
6、人工智能幻覺(jué)如何影響對(duì)人工智能系統(tǒng)的信任?
答:幻覺(jué)會(huì)破壞人們對(duì)人工智能的信任,因?yàn)槿绻麤](méi)有經(jīng)過(guò)驗(yàn)證,人們就很難依賴系統(tǒng)的輸出。
7、有沒(méi)有什么關(guān)于人工智能幻覺(jué)的著名例子?
答:值得注意的例子包括,聊天機(jī)器人生成虛假的學(xué)術(shù)論文,或在客戶服務(wù)互動(dòng)中提供不正確的信息。
8、人工智能幻覺(jué)是否會(huì)同時(shí)出現(xiàn)在語(yǔ)言和視覺(jué)系統(tǒng)中?
答:是的,人工智能幻覺(jué)可能發(fā)生在語(yǔ)言模型和計(jì)算機(jī)視覺(jué)系統(tǒng)中。
9、訓(xùn)練數(shù)據(jù)在人工智能幻覺(jué)中起什么作用?
答:訓(xùn)練數(shù)據(jù)至關(guān)重要;有偏見(jiàn)或不具代表性的數(shù)據(jù)可能會(huì)導(dǎo)致反映這些偏見(jiàn)的幻覺(jué)。
10、是否有正在進(jìn)行的研究來(lái)解決人工智能幻覺(jué)問(wèn)題?
答:是的,有大量研究致力于了解和減輕人工智能幻覺(jué),以提高人工智能系統(tǒng)的可靠性。
- 萬(wàn)通發(fā)展:終止收購(gòu)索爾思光電60.16%股份
- 聯(lián)特科技預(yù)計(jì)2024年凈利潤(rùn)同比增長(zhǎng)220.96%—334.25%
- 有方科技預(yù)計(jì)2024年凈利潤(rùn)同比增長(zhǎng)365.41%
- 800G和400G高端光模塊銷售大增 中際旭創(chuàng)2024年凈利潤(rùn)增長(zhǎng)111.64%—166.85%
- 亞信安全:預(yù)計(jì)2024年實(shí)現(xiàn)扭虧為盈
- Arm發(fā)布芯粒系統(tǒng)架構(gòu)首個(gè)公開(kāi)規(guī)范,加速芯片技術(shù)演進(jìn)
- 中國(guó)鐵塔擬新購(gòu)一套應(yīng)急無(wú)人直升機(jī)空中基站
- 427780臺(tái) 中國(guó)鐵塔啟動(dòng)智能維護(hù)攝像機(jī)產(chǎn)品集中招標(biāo)
- 規(guī)模267904臺(tái) 中國(guó)鐵塔啟動(dòng)2025年自研邊緣網(wǎng)關(guān)合作伙伴招標(biāo)
- 國(guó)家數(shù)據(jù)局聲明:未授權(quán)任何“數(shù)據(jù)要素×”相關(guān)有償活動(dòng)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。