我們所面臨的這一次人工智能崛起,來自于數(shù)據(jù)量的增長和深度學(xué)習(xí)發(fā)展,傳感器為智能體打造一個完全結(jié)構(gòu)化的數(shù)據(jù)世界,再從中抽取規(guī)律,讓智能體可以自主作業(yè)。
這樣形成的結(jié)果是,人工智能進(jìn)入物理領(lǐng)域要比進(jìn)入虛擬領(lǐng)域困難的多。我們可以看到處理圖像、語音、文字等等數(shù)據(jù)的AI拍照、語音助手、智能推薦表現(xiàn)都很優(yōu)秀,可在工業(yè)、自動駕駛等等與現(xiàn)實世界相交的領(lǐng)域,卻因為需要大量測試訓(xùn)練而進(jìn)展相對緩慢。至于看護(hù)機(jī)器人、服務(wù)機(jī)器人這些靈活性更強(qiáng)的領(lǐng)域,人工智能的表現(xiàn)就更加差勁了。
原因在于物理世界缺乏較好的數(shù)據(jù)結(jié)構(gòu)化條件,所需解決的問題又有極大的靈活性,就讓人工智能的學(xué)習(xí)和訓(xùn)練變得格外復(fù)雜。具體來講,在極端情況下我們可以教會機(jī)器人手臂把水壺里的水倒在水杯里,但一旦水壺或水杯的位置產(chǎn)生了變化,機(jī)器人的動作就會一團(tuán)糟。
但如果我們把水杯和水壺可能出現(xiàn)的每一個位置都作為數(shù)據(jù)輸入,對機(jī)器手臂進(jìn)行深度學(xué)習(xí)訓(xùn)練,這其中的工作成本是難以想象的。
深度學(xué)習(xí)“衰落”?元學(xué)習(xí)崛起
在最近,很多人都在討論所謂“深度學(xué)習(xí)”的衰落,其中提到的一個原因就是物理世界中深度學(xué)習(xí)能解決的問題是有限的,如果只依靠傳感器收集數(shù)據(jù)、再從數(shù)據(jù)中挖掘規(guī)律,成本會高居不下。
所以我們想象中在家中走來走去滿足人們需求的小機(jī)器人遲遲不能出現(xiàn),推薦算法對我們的深入了解卻讓人毛骨悚然。就給人一種“深度學(xué)習(xí)讓人工智能往奇怪的方向發(fā)展”的觀感。
但深度學(xué)習(xí)不能做到的,不代表人工智能不能做到。在意識到了深度學(xué)習(xí)的缺陷之后,很多研究機(jī)構(gòu)和企業(yè)開始試圖用更少的數(shù)據(jù)和更簡單的訓(xùn)練過程來解決物理世界的人工智能問題。
在理想狀態(tài)下,人工智能的學(xué)習(xí)應(yīng)該和人類學(xué)習(xí)一樣。當(dāng)我們學(xué)習(xí)拿筷子、系鞋帶這類動作時,通常都是通過別人的示范之后學(xué)會,而不是精確計算出每一根鞋帶之間的距離要有幾厘米。
實現(xiàn)這一目標(biāo),采用方式通常被稱為“元學(xué)習(xí)”(Meta Learning),元學(xué)習(xí)具體指的是讓智能體掌握的能力不局限于某一環(huán)境下的某一模型,而是真正掌握學(xué)習(xí)的能力,讓智能體可以從容應(yīng)對種種新任務(wù),節(jié)省下復(fù)雜的收集數(shù)據(jù)、訓(xùn)練模型的過程。
看一眼就會的機(jī)器人,距離我有多遠(yuǎn)?
這樣的描述或許有些難以理解,但我們可以從元學(xué)習(xí)的一種具體解決方案來解釋——一眼學(xué)習(xí)(One Shot learning)。
一眼學(xué)習(xí)就是我們所說的,和人類一樣看一眼示范就能學(xué)會動作的能力。以往來說讓機(jī)器人模仿人類的動作并不是什么新鮮事,但想要讓機(jī)器人的模仿行為可以應(yīng)用到現(xiàn)實中,需要至少兩百次專業(yè)示范的數(shù)據(jù),還要將人類的動作邏輯和機(jī)器人的部件進(jìn)行一一的映射。
但在UC Berkeley人工智能實驗室的研究中,采取了未知模型學(xué)習(xí)和模仿學(xué)習(xí)結(jié)合的方法,先用大量操作示范建立數(shù)據(jù)集,從中提取基礎(chǔ)的操作策略參數(shù),再給智能體進(jìn)行單一的一次示范,智能體就可以從中找到對應(yīng)的位置模型操作策略,從而可以通過一次示范,就能讓機(jī)器人操縱從沒見過的物體了。同時這一切都是通過計算機(jī)視覺進(jìn)行的,利用攝像頭或者視頻錄入都可以。
目前通過一眼學(xué)習(xí),UCBerkeley人工智能實驗室已經(jīng)實現(xiàn)了讓機(jī)器人一眼學(xué)會分辨不同顏色的球體并放入紙杯、移動物體、堆疊物體等等。
除了一眼學(xué)習(xí)外,元學(xué)習(xí)還有很多其他解決方案,例如用記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)和順序生成神經(jīng)網(wǎng)絡(luò)幫助智能體從少量數(shù)據(jù)樣本中泛化概念的“少數(shù)據(jù)學(xué)習(xí)”,又比如將元學(xué)習(xí)建立在增強(qiáng)獎勵機(jī)制之上,以更強(qiáng)的獎勵/監(jiān)督機(jī)制讓智能體從少量樣本中得到高強(qiáng)度的訓(xùn)練等等。
元學(xué)習(xí)從實驗室進(jìn)入現(xiàn)實還有多遠(yuǎn)?
目前看來元學(xué)習(xí)基本都還停留在實驗室當(dāng)中,尚未進(jìn)入現(xiàn)實應(yīng)用。不過在產(chǎn)學(xué)結(jié)合格外緊密的今天,元學(xué)習(xí)進(jìn)入我們身邊并不遙遠(yuǎn)。
但目前來看,元學(xué)習(xí)距離實際應(yīng)用還有以下這些問題需要解決:
第一點是元學(xué)習(xí)數(shù)據(jù)庫的建立。不管是一眼學(xué)習(xí)還是少數(shù)據(jù)學(xué)習(xí),雖然在訓(xùn)練過程中大大精簡,但進(jìn)行訓(xùn)練之前依然需要建立示范數(shù)據(jù)集。雖然元學(xué)習(xí)的數(shù)據(jù)集相比其他技術(shù)模型的數(shù)據(jù)集更具有通用性,但建立的過程依然是個大工程。如果出現(xiàn)當(dāng)年李飛飛和Image Net那樣極具號召性的數(shù)據(jù)集工程,或許可以進(jìn)一步推動元學(xué)習(xí)的發(fā)展。
第二點是動作序列的連續(xù)性,今天元學(xué)習(xí)雖然已經(jīng)可以成功地完成快速動作學(xué)習(xí),但所能執(zhí)行的都是一些非常簡單的動作,比如分揀、物品移動等等。元學(xué)習(xí)雖然提升了訓(xùn)練效率,但這些簡單動作用其他訓(xùn)練模式執(zhí)行也非常簡單。如何利用完成元學(xué)習(xí)動作的銜接或執(zhí)行更復(fù)雜的工作,是讓元學(xué)習(xí)幫助人工智能進(jìn)入物理世界的關(guān)鍵。
目前來看,元學(xué)習(xí)最大功效是讓降低物理世界應(yīng)用人工智能的成本的門檻。像是自動分揀這項簡單的工作,雖然技術(shù)程度不高,但往往也只有大型工廠才能應(yīng)用上。因為其中復(fù)雜的訓(xùn)練過程和對應(yīng)用環(huán)境數(shù)據(jù)結(jié)構(gòu)化的高要求,形成了很高的成本,只有在大型生產(chǎn)活動中才能攤平成本。
而對元學(xué)習(xí)來講,出去示范動作訓(xùn)練集這一項“共用成本”,企業(yè)應(yīng)用起來幾乎是不需要任何成本的——不需要專業(yè)人士對機(jī)械進(jìn)行復(fù)雜的調(diào)試,也不需要在生產(chǎn)線上加入各種傳感器,任何人都可以進(jìn)行示范,做人工智能的老師。
從元學(xué)習(xí)的發(fā)展我們可以看出,相比理想狀態(tài),深度學(xué)習(xí)的應(yīng)用成本還是非常高的。但人工智能的發(fā)展趨勢,一定是不斷向低門檻、低成本的方向流動,元學(xué)習(xí)就是解決途徑之一。
或許到了未來,人工智能會變成一種唾手可得的資源,讓科幻電影里機(jī)器人可以陪伴每一個人。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 《柳葉刀》:30歲得糖尿病減壽14年?中國科學(xué)家立大功,借干細(xì)胞實現(xiàn)100%治愈
- 營收飄紅,股價綠了!攜程有點冤!
- 李嘉誠蟬聯(lián)香港首富,白手起家傳奇背后,岳父莊靜庵對其助益良多
- 炒股被套“割肉”,虧損九千多萬,江西富豪熊賢忠怒告長園集團(tuán)
- 蜜雪冰城,大夢難成
- 榮耀一箭,射穿PC行業(yè)的蘋果屏障
- 榮耀阿爾法戰(zhàn)略發(fā)布,以開放向全球領(lǐng)先的AI終端生態(tài)公司轉(zhuǎn)型
- RPA怎么了?2025年或?qū)?qiáng)的可怕!
- 小米五年高端化交作業(yè):小米15 Ultra、SU7 Ultra、米家中央空調(diào)Pro等重磅發(fā)布,向超高端進(jìn)發(fā)!
- 完美日記失寵,毛戈平上位,美妝圈風(fēng)云突變!
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。