像FIFA一樣踢球的AI,比打游戲更強(qiáng)嗎?

原標(biāo)題:像FIFA一樣踢球的AI,比打游戲更強(qiáng)嗎?

還記得被阿爾法狗支配的恐懼嗎?最新的“AI恐怖故事”,是谷歌教AI踢足球,打造“AI版貝克漢姆”。

其實(shí),這個(gè)足球人工智慧研究專案Google Research Football,早在今年6月就出現(xiàn)在了谷歌報(bào)告上,而更早一些時(shí)間,就在Github上以開(kāi)源的形式發(fā)布了足球環(huán)境游戲的測(cè)試版代碼。

以谷歌“AI界頂流”的咖位,加上當(dāng)今的資訊效率,現(xiàn)在才突然一波走紅,反射弧委實(shí)有點(diǎn)過(guò)長(zhǎng)了。難道是媒體們集體不蹭熱點(diǎn),改成冷飯熱炒了?

答案或許處在“下一代AI”這個(gè)充滿遐想的泛濫標(biāo)題里,用一個(gè)上古時(shí)期的互聯(lián)網(wǎng)話術(shù)來(lái)說(shuō),就是聽(tīng)起來(lái)很性感。

此前在《星際爭(zhēng)霸》《DOTA2》里超越人類電競(jìng)隊(duì)伍的AI,都沒(méi)能獲此殊榮,踢個(gè)足球就引領(lǐng)未來(lái),AI和AI的差別咋就這么大呢?

這一代AI的上升空間還有多大?

大眾已經(jīng)越來(lái)越明白,AI不能變魔術(shù)了。然而將時(shí)間倒回到2016年,相信絕大部分人都不會(huì)否認(rèn),擔(dān)心工作被AI替代,被機(jī)器人網(wǎng)紅索菲亞嚇得瑟瑟發(fā)抖,覺(jué)得《終結(jié)者》《黑客帝國(guó)》《西部世界》早晚要來(lái),都是切身體會(huì)過(guò)的心路歷程。

傳統(tǒng)的“AI恐怖故事”宣告破產(chǎn),一方面得益于各路技術(shù)大牛日積月累地科(懟)普(人),同時(shí)也跟建立在深度學(xué)習(xí)基礎(chǔ)上的技術(shù)上限有關(guān)。

比如建立在龐大的數(shù)據(jù)運(yùn)算基礎(chǔ)上,訓(xùn)練AI玩電子游戲往往就需要花費(fèi)數(shù)十萬(wàn)美元;比如黑箱性,沒(méi)有一個(gè)深度學(xué)習(xí)結(jié)構(gòu)(卷積、RNN、LSTM、GAN 等)可以解釋自己的決策,暗搓搓地搞歧視、罵人、發(fā)明新語(yǔ)種之類的事情層出不窮;再比如只會(huì)做“填空題”,面對(duì)需要引用常識(shí)、共識(shí)、推理等問(wèn)題的時(shí)候就會(huì)表現(xiàn)的像個(gè)智障,容易被糊弄,比如將打印的人臉識(shí)別成真的,要么就是智商不及預(yù)期,醫(yī)療診斷、機(jī)器人、自動(dòng)駕駛等始終進(jìn)展緩慢……一貫反骨的馬斯克,前不久就推出了基于計(jì)算機(jī)視覺(jué)感知的無(wú)人駕駛新方案。

總體來(lái)說(shuō),深度學(xué)習(xí)真正能成功做到的,還是在給定大量人為標(biāo)注數(shù)據(jù)的情況下,實(shí)現(xiàn)兩個(gè)空間事物之間的映射。距離人們預(yù)想中的AGI強(qiáng)人工智能真是“事倍功半”,極其遙遠(yuǎn)。

所以,著名的“唱衰AI”專家 Filip Piekniewski聲稱將“AI寒冬”的鍋甩給了深度學(xué)習(xí),雖然有些聳人聽(tīng)聞,也未嘗不是指出了一個(gè)切實(shí)而嚴(yán)峻的問(wèn)題——如果以深度學(xué)習(xí)為基礎(chǔ)的AI應(yīng)用不再繼續(xù)提升,那么相關(guān)產(chǎn)業(yè)走到“窮途末路”(尤其是那些to VC項(xiàng)目),也是早晚的事~

DL不是終極算法,不妨繼續(xù)沉迷游戲

既然都這樣了,那還怎么做AI?理論上有兩個(gè)角度:一是深度學(xué)習(xí)的自我進(jìn)化,在原有的基礎(chǔ)上引入新技術(shù)彌補(bǔ)一些先天不足;另一個(gè)則是尋找“備胎”,扶持AI領(lǐng)域的其他流派上位。

目前看來(lái),科技企業(yè)也確實(shí)都極其渴盼變量出現(xiàn),不過(guò)他們更青睞于做溫和的“改良派”,畢竟“徹底推翻腐朽政權(quán)”還需要一個(gè)漫長(zhǎng)的培養(yǎng)接班人的過(guò)程。

以谷歌Football Engine為例,就讓智能體借助獎(jiǎng)勵(lì)機(jī)制來(lái)自己get動(dòng)態(tài)策略,從而學(xué)會(huì)規(guī)則與踢球技能(強(qiáng)化學(xué)習(xí))。

不過(guò),要稱之為“下一代AI”未免有點(diǎn)拔苗助長(zhǎng)。

首先,“可玩性足球”(Gameplay Football)并沒(méi)有完全擺脫深度學(xué)習(xí)的窠臼。系統(tǒng)根據(jù)對(duì)手的實(shí)力不同,提出了簡(jiǎn)單、終極、困難這三個(gè)版本的基準(zhǔn)問(wèn)題,其中簡(jiǎn)單級(jí)別的比賽應(yīng)用單一機(jī)器算法,而困難級(jí)別則是由分布式深度學(xué)習(xí)算法來(lái)處理的。

而且,系統(tǒng)所采用的訓(xùn)練方式(即強(qiáng)化學(xué)習(xí)),與OpenAI Five在游戲Dota 2中擊敗了世界級(jí)電子競(jìng)技隊(duì)OG,deepmind在《魔獸爭(zhēng)霸》人機(jī)對(duì)戰(zhàn)中獲勝時(shí)所采用的訓(xùn)練方式,并沒(méi)有本質(zhì)上的區(qū)別,都是讓智能體在復(fù)雜的即時(shí)戰(zhàn)略游戲中學(xué)會(huì)與環(huán)境交互,并解決復(fù)雜的任務(wù)。

同時(shí),作為機(jī)器學(xué)習(xí)的一個(gè)分支,強(qiáng)化學(xué)習(xí)之于AGI依然遙遠(yuǎn)。深度學(xué)習(xí)三巨頭的Yann LeCun 和Hinton都認(rèn)為,當(dāng)前用來(lái)實(shí)現(xiàn)“人工智能效果”的技術(shù),對(duì)實(shí)現(xiàn)(真正的)人工智能是行不通的。就像怎么優(yōu)化馬車的核心技術(shù),也無(wú)法造出汽車一樣。

更何況,類似的彌補(bǔ)深度學(xué)習(xí)不足的機(jī)器學(xué)習(xí)方法還有很多。

比如小樣本學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)就擺脫了對(duì)大規(guī)模數(shù)據(jù)集和人類專家監(jiān)督的需求,提升自主訓(xùn)練效率;元學(xué)習(xí)解決了深度學(xué)習(xí)訓(xùn)練出的智能體技能單一、缺乏常識(shí)的問(wèn)題。深度學(xué)習(xí)大神Hinton在2015年還提出了一個(gè)黑科技——知識(shí)蒸餾(Knowledge Distillation),通過(guò)遷移知識(shí),借助訓(xùn)練好的大模型得到更加適合推理的小模型,從而提升深度學(xué)習(xí)在大規(guī)模計(jì)算集群上的訓(xùn)練表現(xiàn)。

總而言之,所謂的“下一代AI”,核心還是彌補(bǔ)深度學(xué)習(xí)在理解能力、多模態(tài)仿生、應(yīng)用性價(jià)比等方面的不足。作為過(guò)渡型方案,這種“深度學(xué)習(xí)+”估計(jì)還會(huì)持續(xù)很長(zhǎng)時(shí)間。不過(guò)距離真正實(shí)現(xiàn)AGI的預(yù)期,依然相去甚遠(yuǎn)。

追尋下一代AI,或許要走向更寬廣的技術(shù)海域

今日我們看到的大多數(shù)AI產(chǎn)品思路,都是以DL(Deep Learning) + GOFAI (Good Old Fashioned AI) 的模式建立起來(lái)的。也就是將深度學(xué)習(xí)與其他算法相結(jié)合,讓“AI”走向千行萬(wàn)業(yè)。

不過(guò)也有不少科學(xué)家是徹底的“革命派”,想了不少幫助AI的新辦法,其中或許也隱藏著破局的可行性。

比如Hinton就試圖通過(guò)膠囊網(wǎng)絡(luò)Capsule Networks來(lái)顛覆傳統(tǒng)的深度學(xué)習(xí)算法,用神經(jīng)元向量代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)的單個(gè)神經(jīng)元節(jié)點(diǎn),讓不同的神經(jīng)元攜帶不同屬性的信息傳導(dǎo)到下一層運(yùn)算,已經(jīng)證明可以像人類的視覺(jué)系統(tǒng)一樣,自動(dòng)將學(xué)到的知識(shí)推廣到不同的新場(chǎng)景中,這被認(rèn)為是未來(lái)讓AI被賦予常識(shí)推理的關(guān)鍵技術(shù)。

還有的專家堅(jiān)持基于邏輯規(guī)則的符號(hào)系統(tǒng)能夠?qū)崿F(xiàn)AI推理,一些學(xué)者和創(chuàng)業(yè)公司就正在用Prolog(一種基于符號(hào)學(xué)的編程語(yǔ)言)開(kāi)發(fā)新工具。理論上可以通過(guò)非常少的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練,自己處理事實(shí)和概念,然后自動(dòng)生成事實(shí)推論。

但總體而言,其他分支的AI流派想要撼動(dòng)“深度學(xué)習(xí)2.0”的主流地位,仍然比較困難。除了產(chǎn)業(yè)端正在大舉投入對(duì)深度學(xué)習(xí)及衍生技術(shù)的應(yīng)用之外,美國(guó)國(guó)防高級(jí)研究計(jì)劃局DARPA甚至籌備了一個(gè)名為“機(jī)器常識(shí)(Machine Common Sense)”的計(jì)劃,旨在推進(jìn)和分享模擬人類常識(shí)性推理的技術(shù)創(chuàng)意,總投資預(yù)計(jì)約為6000萬(wàn)美元。

作為標(biāo)桿的深度學(xué)習(xí)及延伸技術(shù),其商業(yè)化潛力,即使“靠山吃山”,也有數(shù)年的好光景可以期待。但必須承認(rèn),面對(duì)其自身的瓶頸,大眾的腎上腺素與技術(shù)期待也開(kāi)始回歸正常值,甚至有點(diǎn)審美疲勞。技術(shù)專家們?cè)俨桓銈€(gè)大事件,熱愛(ài)“AI鬼故事”的科技編輯們都要被逼禿頭了……

值得探索的下一代產(chǎn)業(yè)AI方向會(huì)在哪里,恐怕與我們的現(xiàn)有認(rèn)知都相去甚遠(yuǎn)。畢竟世界上每一次巨大的變革,總是開(kāi)始于某一些被忽視的技術(shù)角落。除了繼續(xù)挑戰(zhàn)技術(shù)的穹頂,谷歌們似乎別無(wú)選擇。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-08-24
像FIFA一樣踢球的AI,比打游戲更強(qiáng)嗎?
深度學(xué)習(xí)大神Hinton在2015年還提出了一個(gè)黑科技——知識(shí)蒸餾(Knowledge Distillation),通過(guò)遷移知識(shí),借助訓(xùn)練好的大模型得到更加適合推理的小模型,從而提升深度學(xué)習(xí)在大規(guī)模計(jì)

長(zhǎng)按掃碼 閱讀全文