原標(biāo)題:深度學(xué)習(xí)面對物理世界無能為力?包教包會的元學(xué)習(xí)或是解決方案
我們所面臨的這一次人工智能崛起,來自于數(shù)據(jù)量的增長和深度學(xué)習(xí)發(fā)展,傳感器為智能體打造一個(gè)完全結(jié)構(gòu)化的數(shù)據(jù)世界,再從中抽取規(guī)律,讓智能體可以自主作業(yè)。
這樣形成的結(jié)果是,人工智能進(jìn)入物理領(lǐng)域要比進(jìn)入虛擬領(lǐng)域困難的多。我們可以看到處理圖像、語音、文字等等數(shù)據(jù)的AI拍照、語音助手、智能推薦表現(xiàn)都很優(yōu)秀,可在工業(yè)、自動駕駛等等與現(xiàn)實(shí)世界相交的領(lǐng)域,卻因?yàn)樾枰罅繙y試訓(xùn)練而進(jìn)展相對緩慢。至于看護(hù)機(jī)器人、服務(wù)機(jī)器人這些靈活性更強(qiáng)的領(lǐng)域,人工智能的表現(xiàn)就更加差勁了。
原因在于物理世界缺乏較好的數(shù)據(jù)結(jié)構(gòu)化條件,所需解決的問題又有極大的靈活性,就讓人工智能的學(xué)習(xí)和訓(xùn)練變得格外復(fù)雜。具體來講,在極端情況下我們可以教會機(jī)器人手臂把水壺里的水倒在水杯里,但一旦水壺或水杯的位置產(chǎn)生了變化,機(jī)器人的動作就會一團(tuán)糟。
但如果我們把水杯和水壺可能出現(xiàn)的每一個(gè)位置都作為數(shù)據(jù)輸入,對機(jī)器手臂進(jìn)行深度學(xué)習(xí)訓(xùn)練,這其中的工作成本是難以想象的。
深度學(xué)習(xí)“衰落”?元學(xué)習(xí)崛起
在最近,很多人都在討論所謂“深度學(xué)習(xí)”的衰落,其中提到的一個(gè)原因就是物理世界中深度學(xué)習(xí)能解決的問題是有限的,如果只依靠傳感器收集數(shù)據(jù)、再從數(shù)據(jù)中挖掘規(guī)律,成本會高居不下。
所以我們想象中在家中走來走去滿足人們需求的小機(jī)器人遲遲不能出現(xiàn),推薦算法對我們的深入了解卻讓人毛骨悚然。就給人一種“深度學(xué)習(xí)讓人工智能往奇怪的方向發(fā)展”的觀感。
但深度學(xué)習(xí)不能做到的,不代表人工智能不能做到。在意識到了深度學(xué)習(xí)的缺陷之后,很多研究機(jī)構(gòu)和企業(yè)開始試圖用更少的數(shù)據(jù)和更簡單的訓(xùn)練過程來解決物理世界的人工智能問題。
在理想狀態(tài)下,人工智能的學(xué)習(xí)應(yīng)該和人類學(xué)習(xí)一樣。當(dāng)我們學(xué)習(xí)拿筷子、系鞋帶這類動作時(shí),通常都是通過別人的示范之后學(xué)會,而不是精確計(jì)算出每一根鞋帶之間的距離要有幾厘米。
實(shí)現(xiàn)這一目標(biāo),采用方式通常被稱為“元學(xué)習(xí)”(Meta Learning),元學(xué)習(xí)具體指的是讓智能體掌握的能力不局限于某一環(huán)境下的某一模型,而是真正掌握學(xué)習(xí)的能力,讓智能體可以從容應(yīng)對種種新任務(wù),節(jié)省下復(fù)雜的收集數(shù)據(jù)、訓(xùn)練模型的過程。
看一眼就會的機(jī)器人,距離我有多遠(yuǎn)?
這樣的描述或許有些難以理解,但我們可以從元學(xué)習(xí)的一種具體解決方案來解釋——一眼學(xué)習(xí)(One Shot learning)。
一眼學(xué)習(xí)就是我們所說的,和人類一樣看一眼示范就能學(xué)會動作的能力。以往來說讓機(jī)器人模仿人類的動作并不是什么新鮮事,但想要讓機(jī)器人的模仿行為可以應(yīng)用到現(xiàn)實(shí)中,需要至少兩百次專業(yè)示范的數(shù)據(jù),還要將人類的動作邏輯和機(jī)器人的部件進(jìn)行一一的映射。
但在UC Berkeley人工智能實(shí)驗(yàn)室的研究中,采取了未知模型學(xué)習(xí)和模仿學(xué)習(xí)結(jié)合的方法,先用大量操作示范建立數(shù)據(jù)集,從中提取基礎(chǔ)的操作策略參數(shù),再給智能體進(jìn)行單一的一次示范,智能體就可以從中找到對應(yīng)的位置模型操作策略,從而可以通過一次示范,就能讓機(jī)器人操縱從沒見過的物體了。同時(shí)這一切都是通過計(jì)算機(jī)視覺進(jìn)行的,利用攝像頭或者視頻錄入都可以。
目前通過一眼學(xué)習(xí),UCBerkeley人工智能實(shí)驗(yàn)室已經(jīng)實(shí)現(xiàn)了讓機(jī)器人一眼學(xué)會分辨不同顏色的球體并放入紙杯、移動物體、堆疊物體等等。
除了一眼學(xué)習(xí)外,元學(xué)習(xí)還有很多其他解決方案,例如用記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)和順序生成神經(jīng)網(wǎng)絡(luò)幫助智能體從少量數(shù)據(jù)樣本中泛化概念的“少數(shù)據(jù)學(xué)習(xí)”,又比如將元學(xué)習(xí)建立在增強(qiáng)獎勵機(jī)制之上,以更強(qiáng)的獎勵/監(jiān)督機(jī)制讓智能體從少量樣本中得到高強(qiáng)度的訓(xùn)練等等。
元學(xué)習(xí)從實(shí)驗(yàn)室進(jìn)入現(xiàn)實(shí)還有多遠(yuǎn)?
目前看來元學(xué)習(xí)基本都還停留在實(shí)驗(yàn)室當(dāng)中,尚未進(jìn)入現(xiàn)實(shí)應(yīng)用。不過在產(chǎn)學(xué)結(jié)合格外緊密的今天,元學(xué)習(xí)進(jìn)入我們身邊并不遙遠(yuǎn)。
但目前來看,元學(xué)習(xí)距離實(shí)際應(yīng)用還有以下這些問題需要解決:
第一點(diǎn)是元學(xué)習(xí)數(shù)據(jù)庫的建立。不管是一眼學(xué)習(xí)還是少數(shù)據(jù)學(xué)習(xí),雖然在訓(xùn)練過程中大大精簡,但進(jìn)行訓(xùn)練之前依然需要建立示范數(shù)據(jù)集。雖然元學(xué)習(xí)的數(shù)據(jù)集相比其他技術(shù)模型的數(shù)據(jù)集更具有通用性,但建立的過程依然是個(gè)大工程。如果出現(xiàn)當(dāng)年李飛飛和Image Net那樣極具號召性的數(shù)據(jù)集工程,或許可以進(jìn)一步推動元學(xué)習(xí)的發(fā)展。
第二點(diǎn)是動作序列的連續(xù)性,今天元學(xué)習(xí)雖然已經(jīng)可以成功地完成快速動作學(xué)習(xí),但所能執(zhí)行的都是一些非常簡單的動作,比如分揀、物品移動等等。元學(xué)習(xí)雖然提升了訓(xùn)練效率,但這些簡單動作用其他訓(xùn)練模式執(zhí)行也非常簡單。如何利用完成元學(xué)習(xí)動作的銜接或執(zhí)行更復(fù)雜的工作,是讓元學(xué)習(xí)幫助人工智能進(jìn)入物理世界的關(guān)鍵。
目前來看,元學(xué)習(xí)最大功效是讓降低物理世界應(yīng)用人工智能的成本的門檻。像是自動分揀這項(xiàng)簡單的工作,雖然技術(shù)程度不高,但往往也只有大型工廠才能應(yīng)用上。因?yàn)槠渲袕?fù)雜的訓(xùn)練過程和對應(yīng)用環(huán)境數(shù)據(jù)結(jié)構(gòu)化的高要求,形成了很高的成本,只有在大型生產(chǎn)活動中才能攤平成本。
而對元學(xué)習(xí)來講,出去示范動作訓(xùn)練集這一項(xiàng)“共用成本”,企業(yè)應(yīng)用起來幾乎是不需要任何成本的——不需要專業(yè)人士對機(jī)械進(jìn)行復(fù)雜的調(diào)試,也不需要在生產(chǎn)線上加入各種傳感器,任何人都可以進(jìn)行示范,做人工智能的老師。
從元學(xué)習(xí)的發(fā)展我們可以看出,相比理想狀態(tài),深度學(xué)習(xí)的應(yīng)用成本還是非常高的。但人工智能的發(fā)展趨勢,一定是不斷向低門檻、低成本的方向流動,元學(xué)習(xí)就是解決途徑之一。
或許到了未來,人工智能會變成一種唾手可得的資源,讓科幻電影里機(jī)器人可以陪伴每一個(gè)人。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。