德?lián)淙藱C大戰(zhàn)落幕 人類無一勝場慘敗79萬分

鳳凰科技訊(作者/王玄璇)4月10日, “冷撲大師V.S.中國龍之隊——人機撲克巔峰表演賽”落下帷幕。經過五天賽事,冷撲大師最終以792,327總記分牌的戰(zhàn)績獲勝,200萬獎勵歸屬冷撲大師。

五天下來冷撲大師累計贏得792,327記分牌數(shù),平均22.0每百手損失大盲。

此次人機撲克大戰(zhàn)巔峰表演賽的發(fā)起人、創(chuàng)新工場CEO、人工智能工程院院長李開復表示:“透過冷撲大師和龍之隊表演賽的對戰(zhàn)結果,人機對戰(zhàn)基本沒有懸念了,據聞AlphaGo近期即將來華和柯潔對戰(zhàn),其實已經不再具有科學意義了。”

圍棋和德州撲克代表了AI處理人機對弈的兩種信息模式——完美信息和不完美信息。在博弈論中,完美信息指后參與者可觀察到前參與者的行為。不完美信息指參與者做選擇的時候不知道其他參與者的選擇。

冷撲大師背后是由卡內基梅隆大學Tuomas Sandholm教授發(fā)明的人工智能Libratus,和AlphaGo不同,Libratus不需要提前背會大量棋譜,也不局限于在公開的完美信息場景中進行運算,而是從零開始,基于撲克游戲規(guī)則針對游戲中對手劣勢進行自我學習,并通過博弈論來衡量和選取最優(yōu)策略。

AlphaGo也通過和自己下棋來學習,但在此之前會分析人類玩家的棋譜學習,再和自己下棋來提高棋藝。

在此次比賽和1月匹茲堡的兩次德?lián)淙藱C對戰(zhàn)中,Libratus和冷撲大師在三個主要技術模塊中都使用了新的算法:包括比賽前采用近于納什均衡策略的計算(Nash Equilibrium strategies)、每手牌中運用終結解決方案(Endgame Solving)、以及根據對手能被識別和利用的漏洞,持續(xù)優(yōu)化戰(zhàn)略打得更為趨近平衡。

這也是冷撲大師在后程越來越兇悍,讓人類玩家難以抵擋的原因之一。在五天的巔峰表演賽中,冷撲大師和中國龍之隊雙方共完成了36,000手牌,每天鏖戰(zhàn)10個小時。

比賽首日中國龍之隊與冷撲大師的積分差距為65,137記分牌,第二日人類落入低谷,差距347,565記分牌、第三日差距233,874記分牌、第四日人機大幅拉近為98,408記分牌、完賽日47,343記分牌,五天下來冷撲大師累計贏得792,327記分牌數(shù),平均22.0每百手損失大盲。

積分差距

中國龍之隊隊長杜悅在談到五天的比賽感想時表示,“人工智能在對戰(zhàn)時不會受到情感、心理、體能等因素影響,且強大運算能力遠超人類大腦,不得不承認冷撲大師很多手牌打得令人拍案叫絕”。

對此,創(chuàng)新工場李開復博士說,人工智能發(fā)展勢不可擋。“我認為,未來的人工智能領域不再是幾個小伙伴就可以打天下的時代了,而是需要頂尖的人工智能科學家、海量數(shù)據、強大的運算能力、以及清晰行業(yè)應用幾大閉環(huán)。”

李開復表示,希望冷撲大師對戰(zhàn)龍之隊這場人工智能的里程碑事件將推動人們對于人工智能的認知,人機撲克對戰(zhàn)中,我們看到了在爾虞我詐、概率不確定、非完美信息需要推理和情商的游戲里,機器一樣可以獲勝,而類似的場景在真實世界中比比皆是。人工智能已經不再只和AlphaGo對標,人工智能已從不完美信息的處理,進步到對不完美信息海量信息運算,并具備了推理和學習能力。

他強調,“我期待下一個更加高明的AI大師級應用登場,而我更愿意相信,這些應用會來自優(yōu)秀的年輕創(chuàng)業(yè)者,而不是諸如BAT等的科技巨頭黑洞”。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2017-04-10
德?lián)淙藱C大戰(zhàn)落幕 人類無一勝場慘敗79萬分
4月10日, “冷撲大師V S 中國龍之隊——人機撲克巔峰表演賽”落下帷幕。經過五天賽事,冷撲大師最終以792,327總記分牌的戰(zhàn)績獲勝,200萬獎勵歸屬冷撲大

長按掃碼 閱讀全文