123,123

Facebook首次開源超級圍棋AI，復(fù)現(xiàn)AI高手AlphaZero

人閱讀

2019-02-15 14:25:00

來源：鎂客網(wǎng)
相關(guān)關(guān)鍵詞
- 人工智能
- AI

最近，F(xiàn)acebook的人工智能研究所（以下簡稱FAIR）宣布，他們開源了自研的圍棋AI訓(xùn)練模型和代碼。這意味著，你可以隨時隨地和Facebook的人工智能下圍棋了，而且此圍棋AI程序重現(xiàn)的是名噪一時的AI高手AlphaZero。

去年5月，F(xiàn)AIR發(fā)布了ELF Open GO，ELF OpenGo是FAIR依照DeepMind在《自然》上發(fā)表的和AlphaGo Zero以及AlphaZero相關(guān)的論文，做出的開源計算機(jī)圍棋程序，也就是說，ELF OpenGo不使用人類棋譜與累積的圍棋知識，僅使用單一類神經(jīng)網(wǎng)絡(luò)從自我對弈中學(xué)習(xí)。

該圍棋AI之前在和韓國棋院的專業(yè)圍棋選手對弈中，都取得不錯的成績。據(jù)悉，OpenGo 的最新版本使用2000塊GPU訓(xùn)練了15天后，在一塊GPU的情況下與4個排名前30的職業(yè)選手進(jìn)行比賽時，取得了20：0全勝的戰(zhàn)績，可謂是戰(zhàn)無不勝。

在這次開源的論文中，F(xiàn)AIR研究人員全面披露了ELF OpenGo的訓(xùn)練過程，包括取得的是三個突破。

一是為ELF OpenGo訓(xùn)練了一個超人類棋藝的模型，他們在2000個GPU上運(yùn)行類AlphaZero的訓(xùn)練軟件9天后，有20個模塊的模型超越了人類水平。

二是提供了模型在訓(xùn)練過程中的行為分析，包括和其他模型的對比、學(xué)習(xí)速度、學(xué)習(xí)難度等等。

三是通過實(shí)施ablation實(shí)驗，以研究AlphaZero風(fēng)格算法的性質(zhì)，他們發(fā)現(xiàn)對于最終模型而言，對局中加倍rollout水平大約提升200 ELO，AI的發(fā)揮會受到模型容量的限制。

最后，此次論文的主要作者為田淵棟，他一直負(fù)責(zé)Facebook的圍棋AI相關(guān)研究，在此前的一篇知乎文章中，他提到：DeepMind不開源也不透露細(xì)節(jié)，文章里面一些地方也沒有寫得很清楚。沒有第一手經(jīng)驗總不是很踏實(shí)。所以本著研究目的，我們需要復(fù)現(xiàn)一下，先有復(fù)現(xiàn)，才有創(chuàng)新，這個是做研究的習(xí)慣。而且如果我們?nèi)タ?ELF OpenGo 的代碼，會發(fā)現(xiàn)其完全適用于其它方向的工作。而圍棋對我們來說，只是一個把算法和平臺做好的手段。在這一點(diǎn)上，花點(diǎn)時間把圍棋做好是值得的。

最后，關(guān)于ELF OpenGo最新訓(xùn)練模型的具體數(shù)據(jù)可以閱讀原文獲取論文鏈接了解。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）