OpenAI推出新項目“草莓”,探索AI推理新技術(shù)

OpenAI正在開發(fā)名為“草莓”的AI項目,以提升其模型的高級推理能力,力求實現(xiàn)自主互聯(lián)網(wǎng)導(dǎo)航與深度研究。

OpenAI正在開發(fā)一個名為“草莓”(Strawberry)的新項目,這一消息來自知情人士和路透社審查的內(nèi)部文件。

這個項目的細(xì)節(jié)此前從未被報道。微軟支持的這家初創(chuàng)公司正在加緊展示其模型能夠提供先進推理能力。

根據(jù)路透社5月看到的一份OpenAI內(nèi)部文件,OpenAI內(nèi)部團隊正在進行“草莓”項目。路透社無法確定文件的具體日期,但文件詳細(xì)說明了OpenAI計劃如何利用“草莓”進行研究。消息人士將該計劃描述為一個正在進行中的項目。路透社無法確定“草莓”距離公開發(fā)布有多近。

消息人士稱,“草莓”的工作原理在OpenAI內(nèi)部也是一個高度保密的秘密。

該文件描述了一個使用“草莓”模型的項目,旨在讓公司的AI不僅能夠生成答案,還能提前計劃,足夠可靠地自主導(dǎo)航互聯(lián)網(wǎng),執(zhí)行OpenAI稱之為“深度研究”的任務(wù)。

根據(jù)與十多位AI研究人員的采訪,這種能力目前尚未被AI模型實現(xiàn)。

當(dāng)被問及“草莓”和這篇報道中提到的細(xì)節(jié)時,OpenAI的一位發(fā)言人在一份聲明中表示:“我們希望我們的AI模型能像我們一樣看到和理解世界。持續(xù)研究新的AI能力是行業(yè)中的常見做法,大家普遍認(rèn)為這些系統(tǒng)的推理能力會隨著時間的推移而改進?!?/p>

這位發(fā)言人沒有直接回應(yīng)有關(guān)“草莓”的問題。

“草莓”項目曾被稱為Q*,路透社去年報道,這個項目在公司內(nèi)部已經(jīng)被視為一次突破。

兩位消息人士描述了今年早些時候看到的Q*演示,OpenAI工作人員告訴他們這些演示能夠回答目前市面上模型無法回答的復(fù)雜科學(xué)和數(shù)學(xué)問題。

據(jù)彭博社報道,周二在一次內(nèi)部全體會議上,OpenAI展示了一個研究項目的演示,聲稱該項目具有新的類似人類的推理能力。OpenAI的一位發(fā)言人確認(rèn)了這次會議,但拒絕提供內(nèi)容的詳細(xì)信息。路透社無法確定展示的項目是否為“草莓”。

熟悉此事的人士表示,OpenAI希望這一創(chuàng)新能顯著提升其AI模型的推理能力,補充說“草莓”涉及一種特殊的方式來處理AI模型,該模型在預(yù)訓(xùn)練了大量數(shù)據(jù)集后進行。

接受路透社采訪的研究人員表示,推理是AI實現(xiàn)人類或超人類智能的關(guān)鍵。

雖然大型語言模型已經(jīng)能夠快速總結(jié)密集文本和創(chuàng)作優(yōu)美的文章,但在解決一些對人類來說直覺性的常識問題時,這項技術(shù)常常表現(xiàn)不佳,比如識別邏輯謬誤和玩井字棋。當(dāng)模型遇到這些問題時,往往會產(chǎn)生虛假的信息。

路透社采訪的AI研究人員普遍認(rèn)為,在AI中,推理涉及到形成一個模型,使得AI能夠提前計劃,反映物理世界的運作方式,并可靠地解決復(fù)雜的多步驟問題。

提升AI模型的推理能力被視為實現(xiàn)從重大科學(xué)發(fā)現(xiàn)到規(guī)劃和構(gòu)建新軟件應(yīng)用程序等一切能力的關(guān)鍵。

OpenAI的CEO Sam Altman今年早些時候表示,在AI領(lǐng)域,“最重要的進展領(lǐng)域?qū)⑹峭评砟芰Α薄?/p>

Google、Meta和Microsoft等公司也在嘗試不同的技術(shù)以改進AI模型的推理能力,幾乎所有進行AI研究的學(xué)術(shù)實驗室也是如此。然而,研究人員對大型語言模型(LLM)是否能夠?qū)⑾敕ê烷L期規(guī)劃融入其預(yù)測方式存在分歧。例如,現(xiàn)代AI的先驅(qū)之一、在Meta工作的Yann LeCun,經(jīng)常表示LLM無法實現(xiàn)類似人類的推理。

AI挑戰(zhàn)

熟悉此事的消息人士稱,“草莓”是OpenAI計劃克服這些挑戰(zhàn)的關(guān)鍵組成部分。路透社看到的文件描述了“草莓”旨在實現(xiàn)的目標(biāo),但沒有說明具體實現(xiàn)方式。

據(jù)四位了解公司情況的人士透露,最近幾個月,OpenAI私下向開發(fā)者和其他外部人士暗示,他們即將推出具有顯著更先進推理能力的技術(shù)。這些人拒絕透露身份,因為他們沒有被授權(quán)談?wù)撍饺耸聞?wù)。

據(jù)其中一位消息人士稱,“草莓”包括一種專門的“后訓(xùn)練”O(jiān)penAI生成AI模型的方法,即在模型已經(jīng)“訓(xùn)練”了大量通用數(shù)據(jù)后,調(diào)整基本模型以特定方式提升其性能。

開發(fā)模型的后訓(xùn)練階段涉及“微調(diào)”等方法,這是幾乎所有語言模型今天都在使用的過程,有多種形式,例如讓人類根據(jù)模型的響應(yīng)提供反饋,并向其提供好的和壞的答案示例。

據(jù)知情人士透露,“草莓”與斯坦福大學(xué)2022年開發(fā)的一種方法“自我教學(xué)推理者”(Self-Taught Reasoner, 簡稱“STaR”)有相似之處。STaR使AI模型能夠通過反復(fù)創(chuàng)建自己的訓(xùn)練數(shù)據(jù)來自我提升智能水平,理論上可用于讓語言模型超越人類智能水平,其創(chuàng)造者之一、斯坦福大學(xué)教授Noah Goodman告訴路透社。

Goodman說:“我認(rèn)為這既令人興奮又可怕……如果事情朝這個方向發(fā)展,我們作為人類有一些嚴(yán)肅的事情需要考慮。” Goodman不隸屬于OpenAI,對“草莓”也不了解。

據(jù)文件顯示,OpenAI希望“草莓”能夠完成長周期任務(wù)(LHT),即需要模型提前計劃并在較長時間內(nèi)執(zhí)行一系列動作的復(fù)雜任務(wù)。

為了實現(xiàn)這一目標(biāo),OpenAI正在創(chuàng)建、訓(xùn)練和評估一種“深度研究”數(shù)據(jù)集。據(jù)OpenAI內(nèi)部文件稱,路透社無法確定該數(shù)據(jù)集的具體內(nèi)容或所需的長時間范圍。

根據(jù)文件和其中一位消息人士,OpenAI特別希望其模型使用這些能力通過“CUA”(計算機使用代理)自主瀏覽互聯(lián)網(wǎng),進行研究,并根據(jù)發(fā)現(xiàn)采取行動。OpenAI還計劃測試其在軟件和機器學(xué)習(xí)工程師工作中的能力。

本文譯自 Reuters,由 BALI 編輯發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2024-07-14
OpenAI推出新項目“草莓”,探索AI推理新技術(shù)
OpenAI正在開發(fā)名為“草莓”的AI項目,以提升其模型的高級推理能力,力求實現(xiàn)自主互聯(lián)網(wǎng)導(dǎo)航與深度研究。

長按掃碼 閱讀全文