如果將美國(guó)憲法輸入某些AI寫(xiě)作檢測(cè)工具,它會(huì)說(shuō)這很可能是AI生成的。但這不可能是事實(shí)。為什么AI寫(xiě)作檢測(cè)工具會(huì)產(chǎn)生錯(cuò)誤的結(jié)果?
在新聞報(bào)道中,過(guò)于熱心的教授因?yàn)閼岩蓪W(xué)生使用AI寫(xiě)作工具而讓整個(gè)班級(jí)不及格,以及孩子們被誤認(rèn)為使用了ChatGPT,這讓教育界感到震驚。一些人認(rèn)為這代表了一種生存危機(jī)。盡管可以依賴AI工具來(lái)檢測(cè)AI生成的文本,但目前的證據(jù)表明它們不可靠。由于錯(cuò)誤的警報(bào),AI寫(xiě)作檢測(cè)器如GPTZero、ZeroGPT和OpenAI的文本分類(lèi)器不能被信任來(lái)檢測(cè)由大型語(yǔ)言模型(LLM)如ChatGPT編寫(xiě)的文本。
為了解釋為什么這些工具會(huì)犯這樣明顯的錯(cuò)誤,我們需要理解AI檢測(cè)背后的概念。
不同的 AI 寫(xiě)作檢測(cè)器使用略有不同的檢測(cè)方法,但基本原理是相同的:有一個(gè) AI 模型,它已經(jīng)在一個(gè)大型文本庫(kù)(包含數(shù)百萬(wàn)個(gè)寫(xiě)作示例)上進(jìn)行訓(xùn)練,并有一組推測(cè)規(guī)則來(lái)確定寫(xiě)作是更有可能由人類(lèi)或 AI 生成的。
例如,GPTZero 的核心是一個(gè)神經(jīng)網(wǎng)絡(luò),它在“一個(gè)大型、多樣化的人類(lèi)寫(xiě)作和 AI 生成文本語(yǔ)料庫(kù)上進(jìn)行訓(xùn)練,重點(diǎn)是英語(yǔ)散文”,根據(jù)該服務(wù)的常見(jiàn)問(wèn)題解答。接下來(lái),系統(tǒng)使用屬性如“困惑度”和“爆發(fā)性”來(lái)評(píng)估文本并進(jìn)行分類(lèi)。
在機(jī)器學(xué)習(xí)中,困惑度是衡量一段文本與 AI 模型在訓(xùn)練期間學(xué)到的程度相差多少的度量。因此,測(cè)量困惑度的思路是,當(dāng) AI 模型(如 ChatGPT)寫(xiě)文本時(shí),它們會(huì)自然而然地求助于它們最了解的東西,這來(lái)自它們的訓(xùn)練數(shù)據(jù)。輸出越接近訓(xùn)練數(shù)據(jù),困惑度評(píng)分就越低。人類(lèi)是更加混沌的寫(xiě)作者,但人類(lèi)也可以用低困惑度寫(xiě)作,尤其是在模仿法律或某些類(lèi)型的學(xué)術(shù)寫(xiě)作中使用的正式風(fēng)格。此外,我們使用的許多短語(yǔ)都出乎意料地常見(jiàn)。
例如,假設(shè)我們正在猜測(cè)短語(yǔ)“我想要一杯 _____”的下一個(gè)詞。大多數(shù)人會(huì)填寫(xiě)“水”、“咖啡”或“茶”。一個(gè)在大量英語(yǔ)文本上進(jìn)行訓(xùn)練的語(yǔ)言模型也會(huì)這樣做,因?yàn)檫@些短語(yǔ)在英語(yǔ)寫(xiě)作中很常見(jiàn)。任何這三種結(jié)果的困惑度都將非常低,因?yàn)轭A(yù)測(cè)是相當(dāng)可靠的。
現(xiàn)在考慮一個(gè)不那么常見(jiàn)的補(bǔ)充:“我想要一杯蜘蛛。” 人類(lèi)和訓(xùn)練有素的語(yǔ)言模型都會(huì)對(duì)這句話感到非常驚訝(或“困惑”),所以它的困惑度會(huì)很高。
如果一段文本中的語(yǔ)言根據(jù)模型的訓(xùn)練沒(méi)有令人驚訝,那么困惑度就會(huì)很低,因此 AI 檢測(cè)器會(huì)更有可能將該文本分類(lèi)為 AI 生成的。這將我們引出美國(guó)憲法這個(gè)有趣的案例。本質(zhì)上,憲法語(yǔ)言在這些模型中根深蒂固,以至于它們將其歸類(lèi)為 AI 生成,從而產(chǎn)生了假陽(yáng)性。
GPTZero 的創(chuàng)建者 Edward Tian說(shuō):“美國(guó)憲法是一篇被反復(fù)輸入到許多大型語(yǔ)言模型的訓(xùn)練數(shù)據(jù)中。因此,許多這些大型語(yǔ)言模型都被訓(xùn)練生成類(lèi)似于憲法和其他常用訓(xùn)練文本的文本。GPTZero 預(yù)測(cè)可能由大型語(yǔ)言模型生成的文本,因此發(fā)生了這種奇妙的現(xiàn)象。”
問(wèn)題在于,人類(lèi)作者也可能創(chuàng)建低困惑度的內(nèi)容,這極大地?fù)p害了 AI 寫(xiě)作檢測(cè)器的可靠性。
GPTZero 還測(cè)量文本的另一個(gè)屬性是“爆發(fā)性”,它指的是某些詞或短語(yǔ)在一段文本中以快速的序列或“爆發(fā)”出現(xiàn)的現(xiàn)象。本質(zhì)上,爆發(fā)性評(píng)估了一段文本中句子長(zhǎng)度和結(jié)構(gòu)的變化程度。
人類(lèi)作者通常會(huì)采用動(dòng)態(tài)的寫(xiě)作風(fēng)格,導(dǎo)致文本具有可變的句子長(zhǎng)度和結(jié)構(gòu)。例如,我們可能會(huì)寫(xiě)一個(gè)長(zhǎng)而復(fù)雜的句子,然后是一個(gè)短而簡(jiǎn)單的句子,或者我們可能會(huì)在一個(gè)句子中使用一連串的形容詞,而在另一個(gè)句子中沒(méi)有任何形容詞。這種可變性是人類(lèi)創(chuàng)造力和即興發(fā)揮的自然結(jié)果。
鑒于 AI 寫(xiě)作檢測(cè)器的錯(cuò)誤報(bào)警率很高,并且可能會(huì)不公平地懲罰非母語(yǔ)英語(yǔ)使用者,很明顯,檢測(cè) AI 生成文本的技術(shù)還遠(yuǎn)非萬(wàn)無(wú)一失——而且可能永遠(yuǎn)不會(huì)是。人類(lèi)可以像機(jī)器一樣寫(xiě)作,機(jī)器也可以像人類(lèi)一樣寫(xiě)作。一個(gè)更有幫助的問(wèn)題可能是:使用機(jī)器輔助寫(xiě)作的人類(lèi)是否理解他們?cè)谡f(shuō)什么?如果有人在使用 AI 工具來(lái)填寫(xiě)他們不理解的事實(shí)內(nèi)容,那么一個(gè)有能力的讀者或老師應(yīng)該很容易就發(fā)現(xiàn)了。
如果老師也是該學(xué)科的專家,他們可以對(duì)學(xué)生的寫(xiě)作進(jìn)行測(cè)試,以了解他們是否真正理解其中的內(nèi)容。寫(xiě)作不僅僅是知識(shí)的展示,也是一個(gè)人聲譽(yù)的體現(xiàn)。如果作者不能為寫(xiě)作中包含的所有事實(shí)負(fù)責(zé),那么 AI 輔助就沒(méi)有被正確使用。
像任何工具一樣,語(yǔ)言模型可以被使用得好或使用得不好。而這種技能也取決于上下文:你可以用畫(huà)筆畫(huà)滿一整面墻,也可以畫(huà)出蒙娜麗莎。這兩種場(chǎng)景都是合適的工具使用方法,但每一種都需要不同水平的人類(lèi)注意力和創(chuàng)造力。同樣,一些重復(fù)性的寫(xiě)作任務(wù)(例如生成標(biāo)準(zhǔn)化的天氣預(yù)報(bào))可以通過(guò) AI 適當(dāng)?shù)丶铀伲鼜?fù)雜的任務(wù)則需要更多的人力和關(guān)注。沒(méi)有簡(jiǎn)單的黑白答案。
本文譯自 Ars Technica,由 bali 編輯發(fā)布。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )