(原標(biāo)題:《財(cái)經(jīng)》獨(dú)家專(zhuān)訪:Alpha“新狗”自學(xué)三天勝人千年背后,谷歌要用它來(lái)做什么?)
北京時(shí)間10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界頂級(jí)科學(xué)雜志Nature雜志上宣布了AlphaGo的新進(jìn)步,可以在沒(méi)有人類(lèi)干預(yù)的情況下自我學(xué)習(xí),新的AlphaGoZero在自我學(xué)習(xí)3天之后,就以100比0的成績(jī)戰(zhàn)勝了第一代AlphaGo。
自我學(xué)習(xí)能力的出現(xiàn),對(duì)于人工智能和機(jī)器學(xué)習(xí)來(lái)說(shuō),是一個(gè)新的突破?!斑^(guò)去人們普遍認(rèn)為機(jī)器學(xué)習(xí)是基于海量的大數(shù)據(jù),但是從AlphaGoZero身上,我們發(fā)現(xiàn)算法比數(shù)據(jù)更重要?!盇lphaGo項(xiàng)目的主要負(fù)責(zé)人戴維·席爾瓦(David Silver)說(shuō)道。
也由于使用了更多的算法和更少的數(shù)據(jù),所以AlphaGoZero只使用了一臺(tái)計(jì)算機(jī)器和4個(gè)TPU,被它打敗的一代AlphaGo則用到多臺(tái)機(jī)器和48個(gè)TPU。
當(dāng)人們驚訝于AlphaGoZero在圍棋領(lǐng)域的神級(jí)水平時(shí),對(duì)于DeepMind團(tuán)隊(duì)來(lái)說(shuō),這才只是剛剛開(kāi)始,他們的目的是通過(guò)培養(yǎng)自主學(xué)習(xí)的能力,來(lái)解決更多其他領(lǐng)域目前無(wú)法解決的棘手問(wèn)題。
從AlphaGo、AlphaGoMaster到AlphaGo Zero
AlphaGo于2015年10月面世,在廣為人知的與棋手李世石對(duì)弈之前,它已經(jīng)打敗了歐洲圍棋冠軍樊麾。樊麾接受《財(cái)經(jīng)》記者采訪時(shí)表示,當(dāng)時(shí)在他看來(lái),一個(gè)計(jì)算程序要打敗職業(yè)棋手是不可能的事情。
結(jié)果他以0-5輸給了AlphaGo,但他也因此加入了DeepMind團(tuán)隊(duì),幫助訓(xùn)練AlphaGo。2016年3月,在他幫助訓(xùn)練下的AlphaGo以4-1的成績(jī)打敗了人類(lèi)頂尖棋手李世石。2017年初,AlphaGo化名為“Master”,在網(wǎng)絡(luò)上挑戰(zhàn)60名人類(lèi)棋手,保持全勝的成績(jī)。2017年5月,在烏鎮(zhèn)的,名為Master的第二代AlphaGo以3-0戰(zhàn)勝了目前人類(lèi)最強(qiáng)棋手柯潔。
今年5月的比賽期間,DeepMind的多位高管就已經(jīng)向《財(cái)經(jīng)》記者透露,Master已經(jīng)實(shí)現(xiàn)了自我學(xué)習(xí)能力,甚至有了自己的“直覺(jué)”,“我們發(fā)現(xiàn)AlphaGo已經(jīng)不需要依賴(lài)人類(lèi)訓(xùn)練師了?!贝骶S·席爾瓦告訴《財(cái)經(jīng)》記者。
與柯潔的對(duì)弈中,AlphaGo已經(jīng)能下出很多人類(lèi)棋手完全無(wú)法想象的路數(shù),比賽后柯潔表示,第一代的AlphaGo還能找到破綻,Master已經(jīng)實(shí)現(xiàn)了“從人到神”的飛躍。
而AlphaGoZero在“獨(dú)立”上更進(jìn)一步,在訓(xùn)練的過(guò)程中,它是自我對(duì)弈。從訓(xùn)練圖上可以看出,由于一開(kāi)始并不熟悉圍棋,對(duì)弈雙方的水平都很弱,但是隨著時(shí)間的推進(jìn),在短短3天互相博弈490萬(wàn)局后,越來(lái)越強(qiáng),實(shí)現(xiàn)了圍棋水平的突破。
人類(lèi)頂尖棋手柯潔被認(rèn)為是圍棋天才,6歲開(kāi)始學(xué)棋,17歲時(shí)在世界范圍內(nèi)排名第一,一個(gè)人類(lèi)天才十幾年的學(xué)習(xí),被AlphaZero用3天時(shí)間超越。
但DeepMind團(tuán)隊(duì)志不在此,“AlphaGo的意義不在于打敗人類(lèi),而是領(lǐng)悟知識(shí),解決更多的問(wèn)題。”戴維·席爾瓦表示。
商業(yè)化加速:1/4精力用于商業(yè)變現(xiàn)
今年5月,DeepMind創(chuàng)始人杰米斯·哈薩比斯在接受《財(cái)經(jīng)》記者采訪時(shí)表示:“如果說(shuō)谷歌是火箭,DeepMind就是燃料。”
在此定位之下,AlphaGo雖然進(jìn)化神速,但絕對(duì)不會(huì)止步于圍棋。
這家公司一開(kāi)始只是一家位于英國(guó)倫敦的人工智能實(shí)驗(yàn)室,研究方向是開(kāi)發(fā)通用自我學(xué)習(xí)算法。2011年,哈薩比斯在埃隆·馬斯克等人的投資下,成立了DeepMind。2014年,谷歌以4億英鎊(約6.5億美元)的價(jià)格收購(gòu)該公司,當(dāng)時(shí)這家公司只有50名員工。AlphaGo就來(lái)自于這家公司。
AlphaGo戰(zhàn)勝韓國(guó)第一棋手李世石引爆了AI技術(shù)和市場(chǎng),也讓DeepMind在谷歌AI戰(zhàn)略中地位舉足輕重。
不過(guò),DeepMind團(tuán)隊(duì)從一開(kāi)始研發(fā)AlphaGo系統(tǒng)的目的就是能實(shí)現(xiàn)行業(yè)應(yīng)用,并帶來(lái)商業(yè)價(jià)值。圍棋為AlphaGo帶來(lái)了光環(huán),卻并非最終目標(biāo)。
哈薩比斯對(duì)《財(cái)經(jīng)》記者說(shuō),“下一階段,DeepMind整個(gè)團(tuán)隊(duì)75%的精力用于人工智能技術(shù)的研發(fā),另外25%精力放在行業(yè)應(yīng)用上。”
具體分工上,哈薩比斯繼續(xù)主導(dǎo)技術(shù)研究,另一位創(chuàng)始人穆斯塔法·蘇萊曼則負(fù)責(zé)主導(dǎo)商業(yè)化。
穆斯塔法認(rèn)為,繼續(xù)技術(shù)研究和商業(yè)化是一種平衡。“我們手里有很多實(shí)驗(yàn)室里的新技術(shù),都是寶貴的資源,而這些技術(shù)的商用不僅能造福社會(huì),一家公司也必須有可持續(xù)的商業(yè)利潤(rùn)來(lái)源。”他告訴《財(cái)經(jīng)》記者。
據(jù)他介紹,目前DeepMind由兩個(gè)團(tuán)隊(duì)組成,哈薩比斯負(fù)責(zé)研發(fā)團(tuán)隊(duì),而他負(fù)責(zé)技術(shù)應(yīng)用業(yè)務(wù)。技術(shù)應(yīng)用團(tuán)隊(duì)又再分為三個(gè)組,一個(gè)組服務(wù)谷歌的產(chǎn)業(yè)和谷歌的其他業(yè)務(wù)部門(mén);第二個(gè)是醫(yī)療組,已經(jīng)與英國(guó)的國(guó)家醫(yī)療健康局合作;第三個(gè)組是能源組,目前還在啟動(dòng)階段。
“這樣的分組是為了方便與不同領(lǐng)域的專(zhuān)家更好地合作?!彼f(shuō)。
此前,DeepMind已經(jīng)牛刀小試,成功利用機(jī)器學(xué)習(xí)為谷歌大幅度節(jié)約電量,帶來(lái)實(shí)際收益。
2016年,DeepMind團(tuán)隊(duì)就利用AlphaGo的學(xué)習(xí)能力,不斷模擬探索更加省電的方案。DeepMind接管了谷歌數(shù)據(jù)中心的一些控制單元,包括風(fēng)扇、空調(diào)、窗戶(hù)和服務(wù)器等,通過(guò)機(jī)器學(xué)習(xí),幫助谷歌數(shù)據(jù)中心的冷卻系統(tǒng)節(jié)約用電40%,并提高了15%的能源使用效率。
哈薩比斯對(duì)《財(cái)經(jīng)》記者說(shuō):“谷歌在數(shù)據(jù)中心設(shè)備上的用電太多,幾個(gè)百分點(diǎn)就意味著每年幾百萬(wàn)美元,節(jié)約電力的算法每分鐘都在給公司省一大筆錢(qián)。”
這個(gè)算法團(tuán)隊(duì)的開(kāi)發(fā)團(tuán)隊(duì)僅有5、6個(gè)人,耗時(shí)僅兩三個(gè)月。
目前,DeepMind的部分研發(fā)項(xiàng)目已經(jīng)開(kāi)始用于能源基礎(chǔ)設(shè)施管理、醫(yī)療系統(tǒng)和潔凈水源的改進(jìn)等方面,公司也已經(jīng)從中獲得收益。
DeepMind也已開(kāi)始進(jìn)軍醫(yī)療市場(chǎng)并從中盈利。2015年11月,它與英國(guó)倫敦皇家自由醫(yī)院簽訂了為期五年的合同,任務(wù)是處理170萬(wàn)名患者的醫(yī)療記錄。
在這次Nature雜志上發(fā)表的論文中,戴維·席爾瓦也強(qiáng)調(diào)了未來(lái)的行業(yè)應(yīng)用,例如蛋白質(zhì)折疊(用于破譯遺傳密碼)、能量節(jié)約以及新材料的研發(fā)等等。
在過(guò)去,機(jī)器學(xué)習(xí)未能得到廣泛應(yīng)用,主要原因之一就在于很多人類(lèi)無(wú)法解決的領(lǐng)域中,也缺少大量的數(shù)據(jù)樣本來(lái)讓機(jī)器進(jìn)行學(xué)習(xí),例如醫(yī)療圖像處理等。AlphaGoZero能夠擺脫人類(lèi)的依賴(lài),不需要人類(lèi)給出數(shù)據(jù)和樣本,這為更廣泛的行業(yè)應(yīng)用提供了新的可能性。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂(lè)Q3持續(xù)穩(wěn)健增長(zhǎng):總收入70.2億元,付費(fèi)用戶(hù)數(shù)1.19億
- 蘋(píng)果Q4營(yíng)收949億美元同比增6%,在華營(yíng)收微降
- 三星電子Q3營(yíng)收79萬(wàn)億韓元,營(yíng)業(yè)利潤(rùn)受一次性成本影響下滑
- 賽力斯已向華為支付23億,購(gòu)買(mǎi)引望10%股權(quán)
- 格力電器三季度營(yíng)收同比降超15%,凈利潤(rùn)逆勢(shì)增長(zhǎng)
- 合合信息2024年前三季度業(yè)績(jī)穩(wěn)健:營(yíng)收增長(zhǎng)超21%,凈利潤(rùn)增長(zhǎng)超11%
- 臺(tái)積電四季度營(yíng)收有望再攀高峰,預(yù)計(jì)超260億美元刷新紀(jì)錄
- 韓國(guó)三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。