精品日韩一区二区三区,国产精品99久久99久久久动漫,成人综合在线观看

繼AlphaGo之后，AlphaGo Zero為何再次刷屏

人閱讀

2017-10-19 18:08:00

相關(guān)關(guān)鍵詞
- 人工智能
- AI

今天，谷歌旗下人工智能(AI)實驗室DeepMind在Nature發(fā)布了這篇論文——在這篇名為《Mastering the game of Go without human knowledge》（不使用人類知識掌握圍棋）的論文中，Deepmind展示了他們更強大的新版本圍棋程序“AlphaGo Zero”， AlphaGo Zero是對著名的AI程序AlphaGo的改進和提升。

AlphaGo AI因在去年3月份擊敗了韓國世界圍棋冠軍李世石（Lee Sedol），又在今年5月烏鎮(zhèn)圍棋大賽時擊敗現(xiàn)任世界圍棋冠軍柯潔而名聲大噪，但它依然無法與AlphaGo Zero相媲美，經(jīng)過3天的訓(xùn)練，AlphaGo Zero就以100：0的比分完勝對陣?yán)钍朗哪前鍭lphaGo。

繼AlphaGo之后，AlphaGo Zero為何再次刷屏

AlphaGo Zero為何如此強大？

一、與自己對弈、自我學(xué)習(xí)

老版AlphaGo AI與AlphaGo Zero之間的主要區(qū)別在于，前者通過吸收人類數(shù)據(jù)學(xué)習(xí)下棋，而后者則不需要。之前所有的AlphaGo AI都是從網(wǎng)站上下載人類數(shù)據(jù)(業(yè)余和職業(yè)圍棋)開始訓(xùn)練的。它們觀看了數(shù)千場比賽，并被告知人類專家在某些位置上的特定動作。但是，AlphaGo Zero并不使用任何人類數(shù)據(jù)。相反，AlphaGo Zero通過與自己對弈學(xué)會了如何玩圍棋，完全是“無師自通”。

繼AlphaGo之后，AlphaGo Zero為何再次刷屏

據(jù)DeepMind AlphaGo項目首席研究員大衛(wèi)·西爾弗（David Silver）介紹，AlphaGo Zero使用了一種新的強化學(xué)習(xí)形式，在這一過程中，它成為了自己的老師。它的起點是一個對圍棋一無所知的神經(jīng)網(wǎng)絡(luò)，它會與自己進行數(shù)千場對弈。它所走的每一步棋就是把這個神經(jīng)網(wǎng)絡(luò)與強大的搜索算法結(jié)合起來，然后用它來選擇下一個動作。

二、不斷更新自身神經(jīng)網(wǎng)絡(luò)

被美國主流網(wǎng)絡(luò)媒體BI稱為谷歌DeepMind的無名英雄的西爾弗繼介紹說：“在每場對弈結(jié)束后，AlphaGo Zero實際上都訓(xùn)練了一個新的神經(jīng)網(wǎng)絡(luò)。它改進了自己的神經(jīng)網(wǎng)絡(luò)，預(yù)測AlphaGo Zero自己的棋路，同時也預(yù)測了這些游戲的贏家。當(dāng)AlphaGo Zero這樣做的時候，實際上會產(chǎn)生一個更強大的神經(jīng)網(wǎng)絡(luò)，這將導(dǎo)致‘玩家’進行新的迭代。因此，我們最終得到了一個新版AlphaGo Zero，它比之前的版本更強大。而且隨著這個過程不斷重復(fù)，它也可以產(chǎn)生更高質(zhì)量的數(shù)據(jù)，并用于訓(xùn)練更好的神經(jīng)網(wǎng)絡(luò)?！?/p>

三、依賴先進的算法

AlphaGo Zero使用的計算能力也比AlphaGo之前的版本要少得多，這表明，算法的進步遠(yuǎn)比計算能力或數(shù)據(jù)進步更重要。AlphaGo Zero是一項重大突破，它為DeepMind的研究贏得了更大的聲譽。在AI研究領(lǐng)域，讓機器在某些任務(wù)中成為“超人”，而不是為它們提供人類數(shù)據(jù)進行訓(xùn)練始終是一項長期存在的挑戰(zhàn)。由于人類數(shù)據(jù)太昂貴、太不可靠或根本無法獲取，從而導(dǎo)致AI研究進展緩慢。

西爾弗補充道:“由于不使用這些人類數(shù)據(jù)、特性或?qū)I(yè)技術(shù)，我們實際上已經(jīng)消除了人類知識的局限性。因此，AlphaGo Zero能夠從最初的原則，從空白石板中創(chuàng)造知識，并制定出自己的策略，以及自己獨特的下棋方式。這使它能夠比以前的版本強大得多。”

盡管AlphaGo Zero的突破已讓人驚嘆，但是研究人員還遠(yuǎn)沒有研究出像好萊塢電影中描述的《機械姬》（Ex-Machina）或《她》（Her）那樣的AI。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）