雷鋒網(wǎng)AI科技評(píng)論按:每次AI領(lǐng)域有重大突破時(shí),甚囂塵上的“AI威脅論”必然會(huì)卷土重來。
2017年10月19日,DeepMind團(tuán)隊(duì)重磅發(fā)布AlphaGo Zero,再次震驚世人。相比上一代AlphaGo,該版本的AlphaGo實(shí)現(xiàn)了在AI發(fā)展中非常有意義的一步——”無師自通“,這也讓去年敗在未升級(jí)版本AlphaGo Master下的中國棋手柯潔驚呼”人類太多余了“。
相信看過之前的報(bào)道都知道,AlphaGo Zero的先進(jìn)之處是可以完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗(yàn)知識(shí),完全靠自己通過強(qiáng)化學(xué)習(xí)(Reinforcement Learning ),左右互搏來增長棋藝,最終達(dá)到百戰(zhàn)百勝。
那是不是就代表AI從此將進(jìn)入到無需人類知識(shí),不受人類控制的時(shí)代?顯然還達(dá)不到。
要想理解為什么,首先從圍棋這個(gè)游戲說起。圍棋是一種對(duì)弈游戲,具體來說就是信息透明,規(guī)則透明,結(jié)構(gòu)明確,并且可用規(guī)則是可以窮舉的。而如果到了一些數(shù)據(jù)無法窮舉的領(lǐng)域,如語音識(shí)別,圖像識(shí)別,自動(dòng)駕駛等,AlphaGo Zero中的算法很難遷移過來,也很難“無師自通”。
那AlphaGo Zero中的算法可以借鑒到哪些領(lǐng)域?他的核心技術(shù)是什么?他的偉大之處又是在哪里?這還得請AI科學(xué)家來談一談。AI科技評(píng)論得知,此版本的AlphaGo所采用的核心技術(shù)就是出自華人團(tuán)隊(duì)研究的深度殘差網(wǎng)絡(luò)(ResNet)。就此背景,雷鋒網(wǎng)聯(lián)系到了深度殘差網(wǎng)絡(luò)ResNet作者之一孫劍博士來對(duì)這次的技術(shù)升級(jí)做闡述。ResNet技術(shù)正是他在微軟亞洲研究院時(shí)期的發(fā)明。
曠視首席科學(xué)家,曠視研究院院長孫劍博士
在他看來,本次技術(shù)提升足夠偉大,但同樣在真實(shí)技術(shù)落地過程中有著眾多局限,并指出未來的主流深度學(xué)習(xí)技術(shù)還將會(huì)圍繞大數(shù)據(jù)訓(xùn)練模式的方式。換句話說,AI想脫離人類控制還為時(shí)尚早。
孫劍博士在接受雷鋒網(wǎng)的采訪過程中說道:“AlphaGo Zero的偉大之處是第一次讓機(jī)器可以不通過任何棋譜,不通過任何人類的經(jīng)驗(yàn),在只告訴規(guī)則的前提下就實(shí)現(xiàn)了成為一個(gè)圍棋高手,這種無師自通的學(xué)習(xí)模式在AI整個(gè)發(fā)展上是非常有里程碑意義的。”孫劍博士講到AlphaGo Zero的技術(shù)意義時(shí)講到,“但是同時(shí)這種無師自通在很多AI落地上也存在一些局限,因?yàn)閲?yán)格的講,圍棋規(guī)則和判定棋局輸贏也是一種監(jiān)督信號(hào),所以嚴(yán)格意義上來講,說人類無用,或者說機(jī)器可以自己產(chǎn)生認(rèn)知都是對(duì)AlphaGo Zero理解的不精確。”
在很多AI行業(yè)落地中,實(shí)際上弱監(jiān)督學(xué)習(xí)或無監(jiān)督或者所謂的無師自通還是無法在短期成為主流。比如,就人臉識(shí)別來講,這個(gè)能力是人類后天學(xué)習(xí)的能力,是通過時(shí)間不斷演化出來的一種生存能力,人只有具備了人臉識(shí)別能力,人類社會(huì)才能正常運(yùn)轉(zhuǎn),把這種后天能力輸出給機(jī)器,其實(shí)就需要人的監(jiān)督信號(hào)。除了人臉識(shí)別,還有很多人工智能研究的方向,比如自然語言處理,都是在模擬人類的一種技能。讓機(jī)器實(shí)現(xiàn)這種任務(wù)就需要海量的數(shù)據(jù)與更多的信號(hào)輸入。再比如醫(yī)學(xué)領(lǐng)域的圖像識(shí)別—AI醫(yī)學(xué)影像讀圖主要依賴于高水平醫(yī)生對(duì)影像的數(shù)據(jù)精標(biāo),從而機(jī)器學(xué)習(xí)對(duì)疾病的識(shí)別,這關(guān)乎于人的生命問題,自然馬虎不得。所以今天,甚至今后很長一段時(shí)間內(nèi),監(jiān)督學(xué)習(xí)依然是AI研究與AI商業(yè)化的主流方向。
關(guān)于AlphaGo Zero中的算法可以借鑒到哪些領(lǐng)域?孫劍博士沒有直接給出答案,而是總結(jié)了此算法為何能在圍棋領(lǐng)域表現(xiàn)如此出色的幾點(diǎn)原因。首先,圍棋它沒有噪聲,能夠完美重現(xiàn)算法;其次圍棋中的黑白子雙方的信息是完全可觀測的。最后,也是他認(rèn)為最重要的一點(diǎn),圍棋對(duì)局可以用計(jì)算機(jī)迅速模擬,很快輸出輸贏信號(hào)??匆粋€(gè)領(lǐng)域是否能借鑒此算法,基本就要看是否滿足以上三點(diǎn)。
AlphaGo的秘密武器:兩大核心要素實(shí)現(xiàn)極簡算法
其實(shí)AlphaGo Zero里面并沒有新的巨大的理論突破,它使用的白板學(xué)習(xí),早在之前的圍棋系統(tǒng)Creazy Stone中就有用過。最主要還是用到了孫劍博士發(fā)明的ResNet技術(shù), 談到該技術(shù)時(shí),他講到: ”AlphaGo Zero的搜索過程簡化了很多,例如把以前系統(tǒng)中的兩個(gè)網(wǎng)絡(luò)合并成一個(gè)網(wǎng)絡(luò)、將深度殘差網(wǎng)絡(luò)的輸入做最簡化。談到本次AlphaGo Zero在技術(shù)特點(diǎn),他認(rèn)為是“把19x19棋局圖像直接送給神經(jīng)網(wǎng)絡(luò),讓神經(jīng)網(wǎng)絡(luò)看著棋盤做決策,這個(gè)非常簡潔。”
AI科技評(píng)論認(rèn)為DeepMind的這一成果的啟發(fā)意義大于借鑒意義。與其想著把算法照搬過來,不如朝AlphaGo Zero啟發(fā)的方向探索。在與孫劍博士在采訪交流中,他表示本次AlphaGo Zero的提升主要有兩個(gè)核心要素,一個(gè)是啟發(fā)式搜索,一個(gè)是深度殘差神經(jīng)網(wǎng)絡(luò),而這兩個(gè)又非常完美的實(shí)現(xiàn)了結(jié)合。其中啟發(fā)式搜索的思想非常樸素,是個(gè)針對(duì)問題設(shè)計(jì)的一個(gè)高級(jí)定制版蒙特卡洛數(shù)搜索算法。另外一個(gè)核心要素是深度殘差神經(jīng)網(wǎng)絡(luò),讓簡單的搜索算法極大的提升了效率。
深度殘差神經(jīng)網(wǎng)絡(luò)在2015年由孫劍在微軟領(lǐng)導(dǎo)的視覺團(tuán)隊(duì)老師率先提出,并在當(dāng)年在ImageNet以及COCO兩大學(xué)術(shù)競賽中包攬五項(xiàng)冠軍,其中最重要的部分就是實(shí)現(xiàn)了突破性的152層的網(wǎng)絡(luò)深度,從而讓一些非常復(fù)雜的函數(shù)做映射時(shí)效率與有效性得到極大的提升。強(qiáng)大的網(wǎng)絡(luò)使得AlphaGo Zero已經(jīng)可以有能力學(xué)習(xí)把每一子下在那里的概率和對(duì)整個(gè)棋局的判斷算的非常準(zhǔn)確。
開放與互通是AI通往未來之路的不二法則
今年,中國發(fā)布了人工智能戰(zhàn)略規(guī)劃,起碼從國家層面上是認(rèn)可AI能給社會(huì)帶來巨大進(jìn)步。在講到AI的未來發(fā)展中,孫劍博士強(qiáng)調(diào)了開放與互通兩個(gè)詞。他講到他現(xiàn)在在曠視研究院每天第一件事情就是去網(wǎng)上開放的論文平臺(tái)ArXiv看是否有新的、有意思的論文、思想發(fā)出來。
最后雷鋒網(wǎng)問道,ResNet被應(yīng)用到AlphaGo Zero上,您有什么感受?孫劍博士表示:“這次應(yīng)用在AlphaGo Zero中的ResNet殘差神經(jīng)網(wǎng)絡(luò),曾獲得了CVPR 2016的最佳論文獎(jiǎng),我也非常高興這個(gè)技術(shù)可以應(yīng)用在AlphaGo Zero系統(tǒng)中,而這個(gè)應(yīng)用過程其實(shí)并不需要我們直接進(jìn)行接觸而是一種研究成果的交流,人工智能研究最前沿的開源與開放,才能讓我們在追求更優(yōu)解的過程中有很多參考與理論支撐,可以極大的提升新技術(shù)產(chǎn)生的周期。”
孫劍博士還介紹到,曠視研究院今后還會(huì)不斷分享、開放研究成果。今年7月份,曠視研究院在ArXiv公開了一篇ShuffleNet的論文,是一種可以運(yùn)行在很多移動(dòng)端上非常低能耗的神經(jīng)網(wǎng)絡(luò)算法,可以說是專為移動(dòng)端而生的算法。發(fā)布至今不光有硬件產(chǎn)品、手機(jī)解鎖產(chǎn)品使用,同時(shí)也有很多同行在使用。
雷鋒網(wǎng)AI科技評(píng)論小結(jié):AlphaGo Zero雖沒有新的突破性的技術(shù),但這絲毫不影響它的偉大,它能夠完美集成已有的技術(shù),給研究者帶來新的啟發(fā),本身已具有里程碑式的意義。他的局限在于目前只能運(yùn)用到特定領(lǐng)域,不過,換個(gè)角度來看,這對(duì)于人類來說未必不是好事兒。總之,AI還有很長的路要走,還需要更多像孫劍博士這樣的科學(xué)家們,不斷借助創(chuàng)新而實(shí)現(xiàn)更多的創(chuàng)新,不斷借助偉大的思想創(chuàng)造偉大的場景。只有不斷的開放最好的認(rèn)知,才能讓AI不斷成長,讓更多更強(qiáng)的AlphaGo Zero產(chǎn)生。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美國ITC裁定聯(lián)想智能手機(jī)侵犯愛立信專利
- 英特爾高通隔空叫陣:兩大巨頭在較什么勁?
- IDC最新預(yù)測:2024年P(guān)C和平板電腦市場將增長3.8%至4.035億臺(tái)
- 蘋果Vision Pro頭顯即將登陸中國臺(tái)灣,12月17日正式發(fā)售
- 全球折疊屏手機(jī)出貨量首次遭遇季度下滑,三星旗艦機(jī)型表現(xiàn)不佳是主因
- HUAWEI Mate X6 震撼登場,折疊引領(lǐng)者,巔峰再跨越
- 五年持續(xù)領(lǐng)跑,華為折疊屏一步領(lǐng)先,一路領(lǐng)先
- 全新HUAWEI MatePad Pro 13.2 英寸首發(fā)亮相,鴻蒙專業(yè)生產(chǎn)力體驗(yàn)再升級(jí)
- 華為凌霄子母路由 Q7 網(wǎng)線版推出,讓每個(gè)房間都有滿格信號(hào)
- 華為發(fā)布HUAWEI WATCH D2,開啟腕上血壓管理新篇章
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。