原標題:深度學(xué)習(xí)面對物理世界無能為力?包教包會的元學(xué)習(xí)或是解決方案
我們所面臨的這一次人工智能崛起,來自于數(shù)據(jù)量的增長和深度學(xué)習(xí)發(fā)展,傳感器為智能體打造一個完全結(jié)構(gòu)化的數(shù)據(jù)世界,再從中抽取規(guī)律,讓智能體可以自主作業(yè)。
這樣形成的結(jié)果是,人工智能進入物理領(lǐng)域要比進入虛擬領(lǐng)域困難的多。我們可以看到處理圖像、語音、文字等等數(shù)據(jù)的AI拍照、語音助手、智能推薦表現(xiàn)都很優(yōu)秀,可在工業(yè)、自動駕駛等等與現(xiàn)實世界相交的領(lǐng)域,卻因為需要大量測試訓(xùn)練而進展相對緩慢。至于看護機器人、服務(wù)機器人這些靈活性更強的領(lǐng)域,人工智能的表現(xiàn)就更加差勁了。
原因在于物理世界缺乏較好的數(shù)據(jù)結(jié)構(gòu)化條件,所需解決的問題又有極大的靈活性,就讓人工智能的學(xué)習(xí)和訓(xùn)練變得格外復(fù)雜。具體來講,在極端情況下我們可以教會機器人手臂把水壺里的水倒在水杯里,但一旦水壺或水杯的位置產(chǎn)生了變化,機器人的動作就會一團糟。
但如果我們把水杯和水壺可能出現(xiàn)的每一個位置都作為數(shù)據(jù)輸入,對機器手臂進行深度學(xué)習(xí)訓(xùn)練,這其中的工作成本是難以想象的。
深度學(xué)習(xí)“衰落”?元學(xué)習(xí)崛起
在最近,很多人都在討論所謂“深度學(xué)習(xí)”的衰落,其中提到的一個原因就是物理世界中深度學(xué)習(xí)能解決的問題是有限的,如果只依靠傳感器收集數(shù)據(jù)、再從數(shù)據(jù)中挖掘規(guī)律,成本會高居不下。
所以我們想象中在家中走來走去滿足人們需求的小機器人遲遲不能出現(xiàn),推薦算法對我們的深入了解卻讓人毛骨悚然。就給人一種“深度學(xué)習(xí)讓人工智能往奇怪的方向發(fā)展”的觀感。
但深度學(xué)習(xí)不能做到的,不代表人工智能不能做到。在意識到了深度學(xué)習(xí)的缺陷之后,很多研究機構(gòu)和企業(yè)開始試圖用更少的數(shù)據(jù)和更簡單的訓(xùn)練過程來解決物理世界的人工智能問題。
在理想狀態(tài)下,人工智能的學(xué)習(xí)應(yīng)該和人類學(xué)習(xí)一樣。當我們學(xué)習(xí)拿筷子、系鞋帶這類動作時,通常都是通過別人的示范之后學(xué)會,而不是精確計算出每一根鞋帶之間的距離要有幾厘米。
實現(xiàn)這一目標,采用方式通常被稱為“元學(xué)習(xí)”(Meta Learning),元學(xué)習(xí)具體指的是讓智能體掌握的能力不局限于某一環(huán)境下的某一模型,而是真正掌握學(xué)習(xí)的能力,讓智能體可以從容應(yīng)對種種新任務(wù),節(jié)省下復(fù)雜的收集數(shù)據(jù)、訓(xùn)練模型的過程。
看一眼就會的機器人,距離我有多遠?
這樣的描述或許有些難以理解,但我們可以從元學(xué)習(xí)的一種具體解決方案來解釋——一眼學(xué)習(xí)(One Shot learning)。
一眼學(xué)習(xí)就是我們所說的,和人類一樣看一眼示范就能學(xué)會動作的能力。以往來說讓機器人模仿人類的動作并不是什么新鮮事,但想要讓機器人的模仿行為可以應(yīng)用到現(xiàn)實中,需要至少兩百次專業(yè)示范的數(shù)據(jù),還要將人類的動作邏輯和機器人的部件進行一一的映射。
但在UC Berkeley人工智能實驗室的研究中,采取了未知模型學(xué)習(xí)和模仿學(xué)習(xí)結(jié)合的方法,先用大量操作示范建立數(shù)據(jù)集,從中提取基礎(chǔ)的操作策略參數(shù),再給智能體進行單一的一次示范,智能體就可以從中找到對應(yīng)的位置模型操作策略,從而可以通過一次示范,就能讓機器人操縱從沒見過的物體了。同時這一切都是通過計算機視覺進行的,利用攝像頭或者視頻錄入都可以。
目前通過一眼學(xué)習(xí),UCBerkeley人工智能實驗室已經(jīng)實現(xiàn)了讓機器人一眼學(xué)會分辨不同顏色的球體并放入紙杯、移動物體、堆疊物體等等。
除了一眼學(xué)習(xí)外,元學(xué)習(xí)還有很多其他解決方案,例如用記憶增強神經(jīng)網(wǎng)絡(luò)和順序生成神經(jīng)網(wǎng)絡(luò)幫助智能體從少量數(shù)據(jù)樣本中泛化概念的“少數(shù)據(jù)學(xué)習(xí)”,又比如將元學(xué)習(xí)建立在增強獎勵機制之上,以更強的獎勵/監(jiān)督機制讓智能體從少量樣本中得到高強度的訓(xùn)練等等。
元學(xué)習(xí)從實驗室進入現(xiàn)實還有多遠?
目前看來元學(xué)習(xí)基本都還停留在實驗室當中,尚未進入現(xiàn)實應(yīng)用。不過在產(chǎn)學(xué)結(jié)合格外緊密的今天,元學(xué)習(xí)進入我們身邊并不遙遠。
但目前來看,元學(xué)習(xí)距離實際應(yīng)用還有以下這些問題需要解決:
第一點是元學(xué)習(xí)數(shù)據(jù)庫的建立。不管是一眼學(xué)習(xí)還是少數(shù)據(jù)學(xué)習(xí),雖然在訓(xùn)練過程中大大精簡,但進行訓(xùn)練之前依然需要建立示范數(shù)據(jù)集。雖然元學(xué)習(xí)的數(shù)據(jù)集相比其他技術(shù)模型的數(shù)據(jù)集更具有通用性,但建立的過程依然是個大工程。如果出現(xiàn)當年李飛飛和Image Net那樣極具號召性的數(shù)據(jù)集工程,或許可以進一步推動元學(xué)習(xí)的發(fā)展。
第二點是動作序列的連續(xù)性,今天元學(xué)習(xí)雖然已經(jīng)可以成功地完成快速動作學(xué)習(xí),但所能執(zhí)行的都是一些非常簡單的動作,比如分揀、物品移動等等。元學(xué)習(xí)雖然提升了訓(xùn)練效率,但這些簡單動作用其他訓(xùn)練模式執(zhí)行也非常簡單。如何利用完成元學(xué)習(xí)動作的銜接或執(zhí)行更復(fù)雜的工作,是讓元學(xué)習(xí)幫助人工智能進入物理世界的關(guān)鍵。
目前來看,元學(xué)習(xí)最大功效是讓降低物理世界應(yīng)用人工智能的成本的門檻。像是自動分揀這項簡單的工作,雖然技術(shù)程度不高,但往往也只有大型工廠才能應(yīng)用上。因為其中復(fù)雜的訓(xùn)練過程和對應(yīng)用環(huán)境數(shù)據(jù)結(jié)構(gòu)化的高要求,形成了很高的成本,只有在大型生產(chǎn)活動中才能攤平成本。
而對元學(xué)習(xí)來講,出去示范動作訓(xùn)練集這一項“共用成本”,企業(yè)應(yīng)用起來幾乎是不需要任何成本的——不需要專業(yè)人士對機械進行復(fù)雜的調(diào)試,也不需要在生產(chǎn)線上加入各種傳感器,任何人都可以進行示范,做人工智能的老師。
從元學(xué)習(xí)的發(fā)展我們可以看出,相比理想狀態(tài),深度學(xué)習(xí)的應(yīng)用成本還是非常高的。但人工智能的發(fā)展趨勢,一定是不斷向低門檻、低成本的方向流動,元學(xué)習(xí)就是解決途徑之一。
或許到了未來,人工智能會變成一種唾手可得的資源,讓科幻電影里機器人可以陪伴每一個人。
- 世間將再無松下電視:松下官宣解散家電子公司并徹底放棄電視機業(yè)務(wù)
- 雅迪集團與南都電源簽署協(xié)議:攜手共繪固態(tài)電池未來藍圖
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。