DeepMind宣布他們下一代AI將結(jié)合AlphaGo和大語(yǔ)言模型的能力

2016年,名為AlphaGo的人工智能程序在谷歌的DeepMind AI實(shí)驗(yàn)室創(chuàng)造了歷史?,F(xiàn)在,DeepMind的聯(lián)合創(chuàng)始人兼首席執(zhí)行官德米斯·哈薩比斯說(shuō),他的工程師們正在使用AlphaGo的技術(shù)來(lái)制造一個(gè)名為Gemini的AI系統(tǒng),它將比OpenAIChatGPT更有能力。

DeepMind的Gemini仍在開(kāi)發(fā)中,是一種大型語(yǔ)言模型,可以處理文本,與OpenAI的GPT-4類(lèi)似。但哈薩比斯說(shuō),他的團(tuán)隊(duì)將把這種技術(shù)與AlphaGo中使用的技術(shù)結(jié)合起來(lái),目標(biāo)是給系統(tǒng)增加一些新的能力,比如規(guī)劃或解決問(wèn)題的能力。

“從高層來(lái)看,你可以把Gemini看作是結(jié)合了AlphaGo類(lèi)型系統(tǒng)的一些優(yōu)勢(shì)和大型模型驚人的語(yǔ)言能力。我們還有一些新的創(chuàng)新,將會(huì)非常有趣?!盙emini是上個(gè)月在谷歌的開(kāi)發(fā)者大會(huì)上首次亮相,當(dāng)時(shí)該公司宣布了一系列新的AI項(xiàng)目。

AlphaGo是基于一種DeepMind開(kāi)創(chuàng)性地使用的技術(shù)——強(qiáng)化學(xué)習(xí)——制造出來(lái)的。這種軟件通過(guò)反復(fù)嘗試和接收反饋來(lái)學(xué)習(xí)如何解決需要選擇行動(dòng)的難題,比如圍棋或視頻游戲。它還使用了一種稱為樹(shù)搜索的方法來(lái)探索和記住棋盤(pán)上可能的走法。語(yǔ)言模型的下一個(gè)重大飛躍可能涉及到它們?cè)诨ヂ?lián)網(wǎng)和計(jì)算機(jī)上執(zhí)行更多任務(wù)。

Gemini仍在開(kāi)發(fā)中,這個(gè)過(guò)程將需要幾個(gè)月的時(shí)間,哈薩比斯說(shuō)。它可能花費(fèi)數(shù)千萬(wàn)或數(shù)億美元。OpenAI首席執(zhí)行官Sam Altman在4月份表示,創(chuàng)建GPT-4花費(fèi)了超過(guò)1億美元。

自從ChatGPT問(wèn)世以來(lái),谷歌已經(jīng)推出了自己的聊天機(jī)器人Bard,并將生成性AI引入了其搜索引擎和許多其他產(chǎn)品中。為了提升AI研究,該公司在4月份將哈薩比斯的部門(mén)DeepMind與谷歌主要的AI實(shí)驗(yàn)室Brain合并為Google DeepMind。哈薩比斯說(shuō),新團(tuán)隊(duì)將把兩個(gè)在最近AI進(jìn)展中具有基礎(chǔ)性作用的實(shí)力派組織結(jié)合起來(lái)。“如果你看看我們?cè)贏I方面的位置,我會(huì)說(shuō)80%或90%的創(chuàng)新都來(lái)自其中一個(gè)或另一個(gè)組織,過(guò)去十年里,兩個(gè)組織都做了很多出色的事情?!?/p>

2014年,DeepMind被谷歌收購(gòu),之前它展示了一些令人印象深刻的結(jié)果,即使用強(qiáng)化學(xué)習(xí)來(lái)讓AI進(jìn)行簡(jiǎn)單的視頻游戲。在接下來(lái)的幾年里,DeepMind展示了這種技術(shù)能夠做一些曾經(jīng)被認(rèn)為是獨(dú)屬于人類(lèi)的事情——而且常常是以超人的技巧。當(dāng)AlphaGo在2016年擊敗圍棋冠軍李世石時(shí),許多AI專(zhuān)家都感到震驚,因?yàn)樗麄冋J(rèn)為要過(guò)幾十年才能讓機(jī)器精通這樣一個(gè)復(fù)雜的游戲。

訓(xùn)練一個(gè)像OpenAI的GPT-4這樣的大型語(yǔ)言模型涉及到向機(jī)器學(xué)習(xí)軟件——稱為變換器——輸入大量來(lái)自書(shū)籍、網(wǎng)頁(yè)和其他來(lái)源的篩選過(guò)的文本。它使用訓(xùn)練數(shù)據(jù)中的模式來(lái)提高預(yù)測(cè)應(yīng)該跟隨一段文本的字母和單詞的能力,這是一種簡(jiǎn)單的機(jī)制,但證明非常強(qiáng)大,可以回答問(wèn)題和生成文本或代碼。

制作ChatGPT和類(lèi)似能力的語(yǔ)言模型的一個(gè)重要額外步驟是使用基于人類(lèi)對(duì)AI模型答案的反饋的強(qiáng)化學(xué)習(xí)來(lái)提高其性能。DeepMind在強(qiáng)化學(xué)習(xí)方面的深厚經(jīng)驗(yàn)可能會(huì)讓其研究人員能夠賦予Gemini新穎的能力。

哈薩比斯和他的團(tuán)隊(duì)也可能?chē)L試用其他AI領(lǐng)域的想法來(lái)增強(qiáng)大型語(yǔ)言模型技術(shù)。DeepMind的研究人員涉及從機(jī)器人到神經(jīng)科學(xué)等領(lǐng)域,本周早些時(shí)候,該公司展示了一種能夠?qū)W習(xí)使用各種不同機(jī)器人手臂執(zhí)行操作任務(wù)的算法。

從現(xiàn)實(shí)世界獲得物理經(jīng)驗(yàn),就像人類(lèi)和動(dòng)物所做的那樣,被廣泛認(rèn)為是對(duì)AI最重要的能力之一。語(yǔ)言模型通過(guò)文本間接地了解世界這一事實(shí)被一些AI專(zhuān)家視為一個(gè)主要限制。

哈薩比斯負(fù)責(zé)加速谷歌的AI工作,同時(shí)也要管理未知且可能?chē)?yán)重的風(fēng)險(xiǎn)。最近語(yǔ)言模型的快速進(jìn)步使許多AI專(zhuān)家(包括一些構(gòu)建算法的人)擔(dān)心這項(xiàng)技術(shù)是否會(huì)被用于惡意用途或變得難以控制。一些科技內(nèi)部人士甚至呼吁暫停開(kāi)發(fā)更強(qiáng)大的算法,以避免創(chuàng)造出危險(xiǎn)的東西。

哈薩比斯說(shuō),AI潛在的巨大好處——比如在健康或氣候等領(lǐng)域進(jìn)行科學(xué)發(fā)現(xiàn)——使得人類(lèi)不應(yīng)該停止開(kāi)發(fā)這項(xiàng)技術(shù)。他還認(rèn)為,強(qiáng)制暫停是不切實(shí)際的,因?yàn)樗鼛缀醪豢赡軋?zhí)行。“如果做得正確,它將是有史以來(lái)對(duì)人類(lèi)最有益的技術(shù),”他說(shuō)。“我們必須大膽而勇敢地追求這些東西?!?/p>

這并不意味著哈薩比斯魯莽沖動(dòng)。自從ChatGPT出現(xiàn)之前,DeepMind就一直在分析AI的潛在風(fēng)險(xiǎn),并由該公司聯(lián)合創(chuàng)始人之一Shane Legg領(lǐng)導(dǎo)了一個(gè)“AI安全”項(xiàng)目書(shū)。

https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2023-06-29
DeepMind宣布他們下一代AI將結(jié)合AlphaGo和大語(yǔ)言模型的能力
2016年,名為AlphaGo的人工智能程序在谷歌的DeepMind AI實(shí)驗(yàn)室創(chuàng)造了歷史。

長(zhǎng)按掃碼 閱讀全文