不靠深度學(xué)習(xí)靠“談判”?德?lián)銩I專家揭秘

卡耐基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長安德魯·摩爾接受采訪卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長安德魯·摩爾接受采訪

冷撲大師沒有使用深度學(xué)習(xí),這多少有點(diǎn)風(fēng)水輪流轉(zhuǎn)的意思。

4月6日,在美國擊敗人類頂尖德州撲克選手的人工智能Liberatus接受創(chuàng)新工場邀請,化名“冷撲大師”,將在海南挑戰(zhàn)中國職業(yè)德州撲克選手組成的“龍之隊(duì)”。賽前在接受新浪科技專訪時(shí),開發(fā)冷撲大師的卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長安德魯·摩爾(Andrew Moore)揭示了在另一場人機(jī)大戰(zhàn)中,戰(zhàn)勝人類背后的基本原理:更加古老的線性規(guī)劃(Liner Programming)。

在解決面對不完整信息,獲得最佳策略的問題方面,線性規(guī)劃早就已經(jīng)成為重要方法。在微觀經(jīng)濟(jì)學(xué)和商業(yè)管理領(lǐng)域當(dāng)中,這種算法已經(jīng)被大量應(yīng)用在降低生產(chǎn)流程成本。而在人工智能領(lǐng)域,它和深度學(xué)習(xí)火熱之前的主流:貝葉斯網(wǎng)絡(luò)技術(shù)息息相關(guān),而后者也目前互聯(lián)網(wǎng)的通用基礎(chǔ)技術(shù)之一。

2017年1月11日,職業(yè)撲克選手賈森·萊斯(Jason Les)在與Libratus較量德州撲克。1月30日,卡耐基梅隆大學(xué)開發(fā)的人工智能結(jié)束了與4名頂尖德州撲克選手之間的比賽,取得勝利。  2017年1月11日,職業(yè)撲克選手賈森·萊斯(Jason Les)在與Libratus較量德州撲克。1月30日,卡內(nèi)基梅隆大學(xué)開發(fā)的人工智能結(jié)束了與4名頂尖德州撲克選手之間的比賽,取得勝利。

在采訪開始前,摩爾表示,德州撲克游戲中包含了大量的隱藏信息,在本質(zhì)上就是一種談判。而通過人工智能談判其實(shí)是卡內(nèi)基梅隆大學(xué)研究團(tuán)隊(duì)的初衷。他表示,贏得撲克游戲勝利能讓人感覺人工智能非常厲害,但他也很期待人工智能能夠在協(xié)商談判并解決問題方面涌現(xiàn)出更多應(yīng)用。

以下為部分采訪實(shí)錄,新浪科技整理:

新浪科技:冷撲大師好像和AlphaGo不一樣,沒有從人類玩牌的結(jié)果中學(xué)習(xí)。德州撲克人工智能和圍棋人工智能有哪些不同?

安德魯·摩爾(以下簡稱AM):撲克是一個(gè)規(guī)則非常簡單的游戲,但是有很多隱藏信息,而圍棋沒有隱藏信息,所以做圍棋方面的人工智能,需要進(jìn)行非常深度的棋譜搜索。而做撲克游戲的人工智能要面對的問題是有非常多的詐唬策略要一一考慮。

新浪科技:冷撲大師有沒有使用到神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)?

AM:冷撲大師沒有使用神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)方面的技術(shù),而是使用了最為傳統(tǒng)的線性規(guī)劃(Liner Programming)。

我可以講得稍微細(xì)一點(diǎn)。計(jì)算機(jī)需要算出最合適數(shù)量的詐,因?yàn)闊o論詐數(shù)量過多或者過少,都可能被其他牌手利用。數(shù)學(xué)家約翰·納什曾經(jīng)計(jì)算出的一個(gè)等式來解決類似的問題,但是要想真的計(jì)算出最合適數(shù)量的詐,這個(gè)等式可能會有無數(shù)的變量,而我們在冷撲大師身上應(yīng)用的計(jì)算機(jī)技術(shù)可以得出最接近正確答案的解決方式。

新浪科技:李開復(fù)之前寫過自己玩德州撲克的感受,他說想要玩好,就要把人性擺在一邊。冷撲大師在比賽時(shí)是靠算牌,還是用統(tǒng)計(jì)方式研究對手打心理戰(zhàn)?

AM:算牌是贏牌的正確方式。不過這樣做的計(jì)算量很大,冷撲大師需要完成1000萬小時(shí)的計(jì)算才能形成它的策略。

但用統(tǒng)計(jì)數(shù)據(jù)來研究對手玩法不是一個(gè)好辦法,因?yàn)橐坏┪抑滥阍诮y(tǒng)計(jì)我的玩法,我就會故意使用變換押注方法,實(shí)際上可以繞開你。

所以就像我剛才說的,冷撲大師沒有使用心理戰(zhàn)贏牌的企圖,只是使用數(shù)學(xué)方法而已。

實(shí)際上過去十年是大數(shù)據(jù)和機(jī)器學(xué)習(xí)發(fā)展的十年。但冷撲大師所用的線性規(guī)劃與這兩者有很大不同,它是實(shí)現(xiàn)最優(yōu)解(Big Optimization)的技術(shù),相信未來的技術(shù)前沿也是實(shí)現(xiàn)最優(yōu)解的技術(shù)。

4月6日,6位華人牌手組成的中國龍之隊(duì)將在海南挑戰(zhàn)Libratus。但隊(duì)長杜悅(左四)表示,龍之隊(duì)的勝算可能只有10%。  4月6日,6位華人牌手組成的中國龍之隊(duì)將在海南挑戰(zhàn)Libratus。但隊(duì)長杜悅(左四)表示,龍之隊(duì)的勝算可能只有10%。

新浪科技:和龍之隊(duì)比賽的賽制,與常見的多人德州撲克牌局不同。為什么會選擇一對一形式的比賽?是和算法限制有關(guān)嗎?

AM:德州撲克中最考驗(yàn)牌手技術(shù)的反而是雙人對戰(zhàn),如果有更多牌手的話,其他牌手間的技術(shù)差別反而會被利用。

新浪科技:除了德州撲克之外,冷撲大師所采用的技術(shù)還可以用在哪些領(lǐng)域?

AM:我最喜歡的商業(yè)用途當(dāng)然是商業(yè)談判,可以通過人工智能來實(shí)現(xiàn)在最合適的時(shí)間,以最合適的價(jià)格找到最合適的供應(yīng)商。

談判其實(shí)是非完整信息博弈理論中一個(gè)不錯的例子,因?yàn)檎勁械臅r(shí)候,我們不一定會透露真實(shí)的想法。我們的研究人員認(rèn)為計(jì)算機(jī)能夠與人類或者其他計(jì)算機(jī)進(jìn)行交談和談判的能力非常重要。計(jì)算機(jī)的這種能力就是我們下一個(gè)研究方向。

實(shí)際上,除了德州撲克之外,相同算法還可以幫助很多需要器官移植的人,比方說Kidney Exchange。在美國,這個(gè)算法每年能幫助數(shù)百位患者實(shí)現(xiàn)腎臟移植的匹配。

新浪科技:所以冷撲大師背后的技術(shù)實(shí)際上是通用的。

AM:冷撲大師所采用的技術(shù)確實(shí)可以應(yīng)用到其他領(lǐng)域,來幫助人類找回丟失掉的信息。比如購買一間公寓,這就是一個(gè)談判過程。如果我聘請的人類房產(chǎn)中介直接告訴賣家我愿意出多少錢買他的房子,那我肯定馬上炒他的魷魚。因?yàn)樗墓ぷ骶褪窃陔[藏我信息的前提下,和賣家達(dá)成交易。

新浪科技:怎么看待中國的人工智能市場?對人工智能開發(fā)者有什么建議?

AM:從投資數(shù)量上能看出中國人工智能市場的發(fā)展是多么欣欣向榮。這是非常明智的投資,因?yàn)楦餍懈鳂I(yè)的自動化是未來經(jīng)濟(jì)增長的強(qiáng)勁動力。

但是,我認(rèn)為一般意義上的人工智能技術(shù)工具,發(fā)展前景其實(shí)不大,而可以直接用于行業(yè)發(fā)展的人工智能才有真正的發(fā)展前景。我喜歡哪些可以將技術(shù)應(yīng)用在已有行業(yè)的人工智能初創(chuàng)公司,而不是那些研發(fā)一般性技術(shù)供其它公司使用的企業(yè)。

就我個(gè)人來說,如果你的初創(chuàng)公司有可以幫助自閉癥兒童快速學(xué)習(xí)的人工智能技術(shù),那我就會有非常強(qiáng)烈的興趣。而如果你的公司有可以讓機(jī)器學(xué)習(xí)更加準(zhǔn)確的技術(shù),那就不是很好了。

2015年,創(chuàng)新工場CEO李開復(fù)獲得卡耐基梅隆大學(xué)授予榮譽(yù)博士畢業(yè)前,與安德魯·摩爾(右一)的合影。  2015年,創(chuàng)新工場CEO李開復(fù)獲得卡內(nèi)基梅隆大學(xué)授予榮譽(yù)博士畢業(yè)前,與安德魯·摩爾(右一)的合影。

新浪科技: 2015年卡內(nèi)基梅隆大學(xué)有將近50名科學(xué)家陸續(xù)被Uber挖走。而人工智能領(lǐng)域的頂尖專家加入企業(yè)也是目前的趨勢。您對當(dāng)前人工智能教育環(huán)境是否有擔(dān)憂?

AM:從2015年1月起,我們新錄用了26名教職員工,而只有4個(gè)人離開。目前匹茲堡(卡內(nèi)基梅隆大學(xué)所在地)也已經(jīng)成為了全世界的自動駕駛技術(shù)中心??蒲袑<壹尤肫髽I(yè)看似是個(gè)問題,但這反而對大學(xué)和匹茲堡都有利。

實(shí)際上,我在擔(dān)任卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長之前,在谷歌從事機(jī)器學(xué)習(xí)系統(tǒng)方面的工作。雖然我喜歡谷歌的哦概念股走,但我還是決定重新回到卡內(nèi)基梅隆大學(xué),因?yàn)楫?dāng)今世界上最頂尖大學(xué)所從事的研究共奏是極其重要的,也將決定21世紀(jì)的發(fā)展情況。而我所需要解決的一個(gè)問題就是,在一個(gè)人工智能已經(jīng)實(shí)現(xiàn)商業(yè)化的世界里,大學(xué)可以扮演什么角色。

比如卡內(nèi)基梅隆在10-15年前就已經(jīng)開發(fā)出了自動駕駛技術(shù),那么下一步應(yīng)該做什么?我們不想一直關(guān)注業(yè)界已經(jīng)在做的事情,而是可以有哪些前瞻性的研究。

對于想離開大學(xué)的教職工,我不是勸留,而是鼓勵他們這樣做。其實(shí)開發(fā)冷撲大師的Toumas Sandholm就已經(jīng)建立了一家公司,叫Strategic Machine Inc.。這家公司就是從卡內(nèi)基梅隆大學(xué)拆分出來的。大學(xué)會將人工智能應(yīng)用在撲克上的技術(shù)授權(quán)給公司,公司再專注與不完整信息博弈的研發(fā)和商業(yè)應(yīng)用。

對于新錄用的人,我其實(shí)會建議他們在這里做4-5年的研究,加入業(yè)界工作上3年,然后再回來做5年研究,這才是應(yīng)該有的職業(yè)生涯,二者都不耽誤。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-03-31
不靠深度學(xué)習(xí)靠“談判”?德?lián)銩I專家揭秘
2017年4月6日至10日,德?lián)銩I“冷撲大師”將在海南迎戰(zhàn)中國龍之隊(duì)。隊(duì)長杜悅表示,龍之隊(duì)的勝算可能只有10%。

長按掃碼 閱讀全文