始于游戲,造福世界:微軟打造史上最強(qiáng)麻將AI

提起棋牌類AI,可能許多人第一時間都會在腦海里想起近年來聲名顯赫的AlphaGo。

作為第一個戰(zhàn)勝人類職業(yè)圍棋選手的AI,AlphaGo的表現(xiàn)確實給我們留下了深刻印象。但是與象棋、圍棋這類完美信息游戲相比,我們所生活的現(xiàn)實世界往往是由非常復(fù)雜的隨機(jī)事件構(gòu)成,無法提前知曉和不確定的信息要遠(yuǎn)遠(yuǎn)超過我們已知和可以確定的信息。

那么在信息如此復(fù)雜和不完全的條件下,我們是否仍然可以依靠AI來做出相對正確的決策?從而更好地解決更多高度復(fù)雜的現(xiàn)實問題?

回答是肯定的。

來自微軟亞洲研究院的AI技術(shù),正在讓許多不可思議的事情變成現(xiàn)實。

史上最強(qiáng)麻將AI的誕生

在2019世界人工智能大會上,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋博士正式宣布微軟創(chuàng)造出了史上最強(qiáng)的麻將AI——Suphx。

雖然只是初試啼聲,但是微軟Suphx的表現(xiàn)已經(jīng)足夠讓人驚艷:在全球頂級的專業(yè)麻將平臺“天鳳”的公開房間競賽中,微軟Suphx通過與人類玩家的五千多場對戰(zhàn)成功晉級十段,這也是目前AI系統(tǒng)在麻將領(lǐng)域取得的最好成績。這意味著作為“史上最強(qiáng)麻將AI”,微軟Suphx的實力已經(jīng)超過了公開房間級別中頂級人類選手的平均水平。業(yè)界人士更是針對其表現(xiàn)給出了“風(fēng)格自成一派,穩(wěn)定段位顯著超越頂尖人類選手”的評價。

從國際跳棋,到國際象棋,到德州撲克,再到圍棋,最后再到麻將,其信息集的復(fù)雜度可以說是經(jīng)歷了量變到質(zhì)變的過程。其中麻將隱藏的信息集平均大小更是高達(dá)10的48次方,遠(yuǎn)遠(yuǎn)超出其他棋牌類游戲。

“很多人都在問:為什么要做麻將AI這樣的技術(shù)?實際上這里面有很多真正的AI技術(shù),譬如說如何有效處理不確定性?如何幫助人類去學(xué)習(xí)和提升技巧?這些技術(shù)不光可以用來做游戲AI,而且還可以引申到其他應(yīng)用場景?!鄙蛳蜓蟛┦勘硎?,“與象棋、圍棋、德州撲克等棋牌類游戲相比,麻將具有更高的復(fù)雜度和更豐富的隱藏信息,因此麻將AI的難度也更高。Suphx可以有效處理麻將中的高度不確定性,在對戰(zhàn)中表現(xiàn)出了類似人類的直覺、預(yù)測、推理、模糊決策能力以及大局意識。”

由此我們可以看到,與象棋、圍棋等完美信息游戲相比,屬于不完美信息游戲的麻將包含了復(fù)雜的推理策略和帶有隨機(jī)性的博弈過程,但也正因為如此,麻將也要比象棋和圍棋更加貼近人類復(fù)雜的真實生活。而作為“史上最強(qiáng)麻將AI”,微軟Suphx的誕生和技術(shù)突破,也將有助于幫助人類應(yīng)對現(xiàn)實世界中更多高度復(fù)雜的問題。

探索麻將AI的新邊界,推動AI技術(shù)的新發(fā)展

“麻將跟其他棋牌不一樣,除了選手本身的技術(shù)之外,還要取決于隨機(jī)抓到的牌。當(dāng)對手的手牌不同,底牌不同,出牌順序不一樣,甚至一次碰、吃、杠,都可能改變之前的策略。跟可以精準(zhǔn)復(fù)刻的圍棋相比,每一局麻將都是一次全新的游戲。因此可能要經(jīng)過上千盤的對弈,才能顯示出選手的技術(shù)和實力?!蔽④泚喼扪芯吭焊痹洪L、機(jī)器學(xué)習(xí)領(lǐng)域負(fù)責(zé)人劉鐵巖博士向趣味科技介紹到。

劉鐵巖博士透露,在做相關(guān)AI研究的過程中,微軟亞洲研究院也遇到了許多瓶頸和難以解決的問題,因此這是一個不斷試錯、發(fā)現(xiàn)挑戰(zhàn)、想辦法解決、再進(jìn)行迭代的過程?!拔④泚喼扪芯吭赫峭ㄟ^這樣一種方式,不斷探索麻將AI的新邊界?!?/p>

Suphx 以“大三元”役滿胡牌

劉鐵巖博士表示,從推動AI技術(shù)的新發(fā)展來看,微軟Suphx的誕生也有著重大意義:

1、Suphx基于多項微軟亞洲研究院發(fā)明的創(chuàng)新人工智能技術(shù):先知教練、全盤預(yù)測、自適應(yīng)決策等。

2、Suphx可以有效處理麻將的高度不確定性,在游戲中表現(xiàn)出類人的直覺、預(yù)測、推理、模糊決策能力,和大局觀意識。

3、Suphx的成果對于探索機(jī)器學(xué)習(xí)的技術(shù)邊界、推動麻將社區(qū)發(fā)展,以及解決真實場景中的復(fù)雜問題都具有重要意義。譬如在智能交通、金融投資等存在大量未知信息,容易受到隨機(jī)突發(fā)狀況影響,并存在多人博弈的領(lǐng)域,Suphx的技術(shù)都將大有可為。

“我們期待通過游戲AI的研究,推動AI技術(shù)的創(chuàng)新發(fā)展,讓人工智能真正走進(jìn)人類的生活,幫助我們解決更加錯綜復(fù)雜的現(xiàn)實挑戰(zhàn)?!眲㈣F巖博士說道。

始于游戲,但并不終于游戲

“和其他棋牌類游戲相比,麻將可以說是趣味性最高、可以讓人一直玩下去的游戲。為什么這么說?”微軟全球資深副總裁、微軟亞太研發(fā)集團(tuán)主席兼微軟亞洲研究院院長洪小文向趣味科技表示,“因為在麻將桌上沒有永遠(yuǎn)的勝利者,即使你技術(shù)差,但是憑借手氣好也有贏的可能。要換成跳棋、象棋、圍棋等游戲,如果你水平不夠的話,基本上永遠(yuǎn)都不可能下贏機(jī)器。所以麻將的復(fù)雜度、不完美信息、隱藏性和隨機(jī)性,就是它最好玩的地方,也是其最大的魅力所在?!?/p>

洪小文舉例說,和麻將類似的是,在我們的日常生活中,也存在很多不確定和非完美信息的場景。譬如收購公司,與對手競爭,都可能要面對大量的不完整信息和博弈?!八晕覀冋娴目梢阅肧uphx這個游戲AI,來解決日常生活中最重要、最困難,具有隱藏信息的各種問題?!?/p>

洪小文透露,通過AI,微軟正在幫助各個產(chǎn)業(yè)做智能化轉(zhuǎn)型。包括醫(yī)療、物流、零售、制造、金融、教育……而這些只是首批獲利的行業(yè)。“事實上,我覺得各行各業(yè)只要能收集足夠的大量數(shù)據(jù),都可以找到最適合AI發(fā)揮作用的場景,這也是人工智能技術(shù)最可愛的地方?!?/p>

微軟全球資深副總裁、微軟亞太研發(fā)集團(tuán)主席兼微軟亞洲研究院院長洪小文

談到微軟針對人工智能領(lǐng)域的戰(zhàn)略布局時,洪小文透露,微軟主要有以下三個方向:

第一,把AI的門檻降低,讓其更加普及,這樣才能讓各行各業(yè)都能夠從AI中受惠。

第二,做AI一定要有平臺。微軟經(jīng)常提到ABC的概念,也就是AI+BigData+Cloud,AI、大數(shù)據(jù)、計算力三者缺一不可。讓微軟引以為豪的正是其擁有全世界領(lǐng)先的ABC平臺,每一家公司都需要這樣的平臺。

第三,最可信賴的合作伙伴。為什么微軟最近能夠重回市值第一?因為相對于其他一些什么都做的企業(yè)來說,作為平臺公司的微軟從來不與合作伙伴競爭,從來不涉及客戶的業(yè)務(wù),所以能夠成為廣大企業(yè)信賴的合作伙伴。

“普及化、ABC平臺、最可信賴的合作伙伴,這就是微軟在AI時代的核心戰(zhàn)略?!焙樾∥谋硎?。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-09-12
始于游戲,造福世界:微軟打造史上最強(qiáng)麻將AI
提起棋牌類AI,可能許多人第一時間都會在腦海里想起近年來聲名顯赫的AlphaGo。作為第一個戰(zhàn)勝人類職業(yè)圍棋選手的AI,AlphaGo的表現(xiàn)確實給我們留下了深刻印象。

長按掃碼 閱讀全文