2016年人工智能這把火燒得很旺,尤其是AlphaGo( 阿爾法狗)對(duì)戰(zhàn)李世石,讓我們真正見識(shí)到了人工智能的可怕。不過,最近筆者花功夫研究了下國(guó)外關(guān)于阿爾法狗圍棋對(duì)弈的人工智能解讀,發(fā)現(xiàn)此前我們聽到的、看到的或者說以為認(rèn)識(shí)到的東西,幾乎都是錯(cuò)的,阿爾法狗可能并非你想的那樣強(qiáng)無(wú)敵。
錯(cuò)誤一:
阿爾法狗可以說是里程碑式地開創(chuàng)了歷史,但是它并沒有作出任何非常創(chuàng)新的技術(shù),而deep mind只是將早已經(jīng)存在的一些人工智能技術(shù)尤其是機(jī)器辨認(rèn)圖片技術(shù)運(yùn)用到下棋上,之前沒有人想過能這樣做,這種嘗試是一種創(chuàng)新。
錯(cuò)誤二:
阿爾法狗并沒有真正的棋感,實(shí)際也不懂得思考并作出策略,圍棋解說把阿爾法狗當(dāng)人來(lái)看待是錯(cuò)誤的。阿爾法狗只是不停問自己,我下這一步我勝率提高了多少。
錯(cuò)誤三:
阿爾法狗并沒有強(qiáng)大的學(xué)習(xí)能力,達(dá)到現(xiàn)在棋力是基于接近1億次棋局的模仿和推測(cè)出來(lái)的,一開始阿爾法狗只學(xué)習(xí)了16萬(wàn)棋局時(shí)它的棋力很弱。他不但比人學(xué)習(xí)效率差而且比馬戲團(tuán)的動(dòng)物學(xué)習(xí)效率更差。所以說,跟李世石對(duì)局每一局都在進(jìn)步是不可能的,一局的經(jīng)驗(yàn)對(duì)阿爾法狗基本沒什么影響。
錯(cuò)誤四:
阿爾法狗其實(shí)也是基于蠻力窮舉的下法,只不過運(yùn)用新的機(jī)器學(xué)習(xí)方法。窮舉法和機(jī)器學(xué)習(xí)不矛盾。
錯(cuò)誤五:
之前看到文章說阿爾法狗速度沒深藍(lán)快,其實(shí)阿爾法狗是深藍(lán)的5萬(wàn)倍,今天用的iPhone6s計(jì)算能力都是深藍(lán)的幾十倍。
錯(cuò)誤六:
說人腦計(jì)算速度慢是錯(cuò)誤的,和計(jì)算機(jī)的計(jì)算速度相對(duì)應(yīng)的,應(yīng)該是人腦神經(jīng)元計(jì)算速度,保守估計(jì)人腦計(jì)算速度是每秒1000萬(wàn)億次,計(jì)算能力是深藍(lán)的10萬(wàn)倍。
錯(cuò)誤七:
阿爾法狗并不是完全學(xué)習(xí)的,首先底層需要人編程圍棋規(guī)則,其次基礎(chǔ)的下棋原則也是人為輸入的。
簡(jiǎn)單總結(jié)一下,其實(shí)包括阿爾法狗圍棋程序和深藍(lán)的象棋都是蠻力搜索法,也就是:其一,考慮所有未來(lái)可能變化;其二,計(jì)算走法未來(lái)多少步的勝率;其三,選擇走法。但是圍棋每走一步比國(guó)際象棋變化更大,步數(shù)更多,可能變化種類超過宇宙原子總和。其實(shí)這對(duì)于象棋也是如此,深藍(lán)雇傭大量職業(yè)象棋選手設(shè)定一個(gè)積分法,比如一個(gè)兵值多少分,吃對(duì)手一個(gè)車勝率提升多少,這個(gè)評(píng)分體系很準(zhǔn)確,深藍(lán)思考范圍被壓縮成十幾步。
但是圍棋無(wú)法如此評(píng)估,之前圍棋程序是簡(jiǎn)單的人手輸入,見到什么情況如何走,所以很死板,這些程序棋力大概是400。
2006年一種叫做蒙特卡洛樹的搜索法被發(fā)明,它使用概率模擬方法(類似模擬投擲骰子),只需要判斷終盤勝負(fù),彌補(bǔ)了圍棋不能設(shè)定確定走法函數(shù)的缺陷(阿爾法狗也是使用蒙特卡洛樹方法)。但是這方法要展開到終盤,計(jì)算量太大,所以需要讓圍棋專家協(xié)助制定行棋規(guī)則,減少計(jì)算量,此方法可使人工智能棋力提升到業(yè)余5段。
但是十年來(lái)電腦棋力進(jìn)展令人悲觀,直到阿爾法狗,它在此基礎(chǔ)上引入深度人工網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)明50年,適合編寫一些不直觀因果關(guān)系的事物,并且軟件可以自主學(xué)習(xí)調(diào)整。但是編程太難,加上以前計(jì)算能力問題一直不受重視。
6年前開始,技術(shù)上能達(dá)到10層神經(jīng)元,神經(jīng)網(wǎng)絡(luò)開始興起。結(jié)合大數(shù)據(jù)和云計(jì)算技術(shù),神經(jīng)網(wǎng)絡(luò)開始吃香。圖像處理和人臉識(shí)別這類程序很難直觀的由編程員編程,神經(jīng)網(wǎng)絡(luò)在此有用武之地,其中深度卷積網(wǎng)絡(luò)技術(shù)稱霸。阿爾法狗團(tuán)隊(duì)創(chuàng)新之處在于,意識(shí)到可以將圖像識(shí)別的這項(xiàng)技術(shù)用于下棋,并將神經(jīng)網(wǎng)絡(luò)升級(jí)到13層,預(yù)測(cè)人類棋手走法。
首先它學(xué)習(xí)了圍棋對(duì)戰(zhàn)平臺(tái)的3千萬(wàn)業(yè)余高段位的對(duì)局記錄,作為讓阿爾法狗猜人類走法的正確答案。也就是說,阿爾法狗一開始是在模仿業(yè)余高手平均玩法,同時(shí)團(tuán)隊(duì)人工輸入圍棋知識(shí)??梢哉f,阿爾法狗是神經(jīng)網(wǎng)絡(luò)加手工編程混合物。
這個(gè)預(yù)測(cè)人類玩法被叫做策略網(wǎng)絡(luò),此時(shí)阿爾法狗叫做RP版。根據(jù)阿爾法狗團(tuán)隊(duì)的論文,把策略網(wǎng)絡(luò)加入業(yè)余3段棋力的圍棋程序,其棋力能達(dá)到業(yè)余6段,棋力提高950分達(dá)到2600(棋力分每相差230分,雙方5局三勝比賽的勝率為高分者95%勝率),此時(shí)alpha已經(jīng)成為世界最強(qiáng)圍棋程序。
為了減少計(jì)算量,阿爾法狗使用一個(gè)叫價(jià)值網(wǎng)絡(luò)的深層卷積網(wǎng)絡(luò)作為評(píng)估函數(shù),使用阿爾法狗的預(yù)測(cè)結(jié)果和實(shí)際展開結(jié)果的平均值作為勝率參考信息。加入此功能的阿爾法狗叫做完整版,其棋力提高了450分,達(dá)到了驚人的3100。
———分割線————
曉楓說,游走在科技與人文之間,新浪創(chuàng)事記、百度百家、砍柴網(wǎng)、搜狐、艾瑞、品途等專欄作者。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。