面對(duì)陌生環(huán)境,機(jī)器人如何像人一樣自由穿行?

原標(biāo)題:面對(duì)陌生環(huán)境,機(jī)器人如何像人一樣自由穿行?

對(duì)移動(dòng)式工作的機(jī)器人來說,如何判斷周邊環(huán)境的安全,以保證暢通無阻是非常重要的。還沒動(dòng)兩步就“咣咣”碰壁,這樣的機(jī)器人就太尷尬了。

典型的是掃地機(jī)器人。說白了,掃地機(jī)器人就是在不斷地碰壁——當(dāng)然,它也不是真碰,而是通過傳感器來判斷周圍有無障礙物,然后繪制出整個(gè)房間里的地圖。完成之后,其就可以愉快地完成掃地工作了。這有點(diǎn)像決策樹,此路不通就另尋他路,也就是通過不斷試錯(cuò),最終試驗(yàn)出正確的路徑來。

但是問題在于,掃地機(jī)器人繪制的家庭地圖只針對(duì)特定的環(huán)境才有效。打個(gè)比方,好不容易把廚房的地圖給畫好了,轉(zhuǎn)身進(jìn)了臥室就又得重新畫圖。別人借走用一用,它又得重新干活。

也就是說,掃地機(jī)器人的這種學(xué)習(xí)的方式是不具備普適性的。挪了地兒就不能用,它既有的工作經(jīng)驗(yàn)在新的環(huán)境中沒有任何用處。它的經(jīng)驗(yàn),是死的。

聰明的讀者一定會(huì)明白我要說什么了:有沒有一種方法,能夠把機(jī)器人的這種死經(jīng)驗(yàn)給盤活,以便擴(kuò)大其適用范圍呢?

答案是,有。

有人開發(fā)了個(gè)模型,就是為了讓機(jī)器人一次跑成

我們造機(jī)器人,就是想要讓機(jī)器獲得類似于人的能力。那么,就針對(duì)掃地這件事來說,人是不需要畫圖的。你抬頭一看,左邊是一扇門,右邊是一堵墻,中間是空地,自然而然就掃中間的。你不會(huì)傻到先碰碰墻再碰碰門,最終才確定中間的空地是能掃的吧?

麻省理工學(xué)院的研究人員就在試圖令機(jī)器獲得這種能力。他們制作了一個(gè)新的神經(jīng)網(wǎng)絡(luò)模型,以便能夠讓機(jī)器人自主地探索環(huán)境,在觀察環(huán)境主體的時(shí)候聯(lián)系到既有的經(jīng)驗(yàn),從而達(dá)到目標(biāo)。

比如我看到一個(gè)門,掃一眼就知道應(yīng)該怎樣以最短的路線去朝門走去。而機(jī)器人則通常是以決策樹來嘗試出無數(shù)種可能,然后選擇最佳的方案。它的問題我們開頭就說了,就是換個(gè)環(huán)境得重新做出決策,既有的經(jīng)驗(yàn)完全沒用。也就是說,機(jī)器人的每一次嘗試,其實(shí)都是第一次。而人知道怎么朝這個(gè)門走去,換做另外一扇門也一眼就能知道。

那么,研究人員的目的就是要讓機(jī)器人在做判斷的時(shí)候,加入其既有的經(jīng)驗(yàn),然后去適應(yīng)新的不同的環(huán)境。其開發(fā)出的模型就是將規(guī)劃算法與神經(jīng)網(wǎng)絡(luò)結(jié)合,學(xué)習(xí)識(shí)別出最佳的路徑,然后用來指導(dǎo)機(jī)器人在陌生的環(huán)境中移動(dòng)。

比如說,研究人員設(shè)計(jì)的一個(gè)模擬實(shí)驗(yàn)。機(jī)器人必須要通過一個(gè)中間狹窄的通道從密室逃出,到達(dá)更大房間里的一個(gè)位置。而在這個(gè)通道兩邊會(huì)有一些由其他物體設(shè)置的陷阱,在機(jī)器人觸碰的時(shí)候卡住它。傳統(tǒng)的機(jī)器人會(huì)挨個(gè)碰一遍,在屢次試錯(cuò)之后繪制通過地圖;而在這個(gè)實(shí)驗(yàn)中,研究人員對(duì)機(jī)器人進(jìn)行了陷阱特征的訓(xùn)練學(xué)習(xí)。于是,在逃跑的過程中,機(jī)器人一邊跑一邊對(duì)眼前的阻擋物進(jìn)行識(shí)別,最終實(shí)現(xiàn)對(duì)周圍環(huán)境的感知,以最快、最佳的路徑達(dá)到目的地。

簡單來說,該模型的特點(diǎn)就是能夠更快地找到更合適的路徑,并培養(yǎng)機(jī)器人自主導(dǎo)航的能力。

掃地姑且不提,駛離大轉(zhuǎn)盤將大有裨益

從研究人員繪制的美好藍(lán)圖當(dāng)中我們依然可以清楚地看到他們的意圖:讓機(jī)器人在開路這方面,更像人。而當(dāng)機(jī)器人的自我導(dǎo)航能從一個(gè)場景“移植”到另一個(gè)場景的時(shí)候,也就意味著大量場景應(yīng)用可能的誕生。

首當(dāng)其沖者必然是掃地機(jī)器人。機(jī)器人買回家之后,第一件事再也不會(huì)是熟悉環(huán)境了。其通過已經(jīng)獲得的訓(xùn)練,放下就能在工作的過程中尋找最優(yōu)路線,真正實(shí)現(xiàn)即插即用。時(shí)不時(shí)來個(gè)“小鹿亂撞”的掃地機(jī)器人時(shí)代也可能將徹底成為過去。

而這項(xiàng)技術(shù)的最大受益者很可能是時(shí)下火熱的自動(dòng)駕駛。

當(dāng)然,長距離導(dǎo)航自然用不上,畢竟有高精地圖、GPS在那兒發(fā)揮著效用。該技術(shù)對(duì)自動(dòng)駕駛汽車的作用之處,在于短距離的、瞬時(shí)的行駛導(dǎo)航?jīng)Q策。

目前而言,要保證自動(dòng)駕駛汽車的安全行駛,研究者為其加入了大量的硬件,激光雷達(dá)、傳感器、毫米波雷達(dá),以及優(yōu)越的算法。按照目前的技術(shù),在直線行駛上和稀松的轉(zhuǎn)完路口,自動(dòng)駕駛車輛基本上可以自如應(yīng)對(duì)。但問題是,如果是車流比較多的路口呢?或者說經(jīng)過大轉(zhuǎn)盤?

谷歌的無人車在測試的過程中就被廣大人類司機(jī)詬病過一個(gè)問題,那就是由于其被設(shè)計(jì)得特別遵守交通規(guī)則、特別禮讓,導(dǎo)致在左轉(zhuǎn)的時(shí)候,自動(dòng)駕駛車總是在等直行車流通過,很長時(shí)間也無法并線匯入車流,哪怕是匯入之后并不影響直行車行駛。這樣跟在后面的司機(jī)當(dāng)然不開心了。要知道人類司機(jī)可以在保證安全的情況下見縫插針,自動(dòng)駕駛車顯然還不行?;蛘哒f不是不行,只是為了保證安全,還不能這樣設(shè)計(jì)。

況且,左轉(zhuǎn)尚且如此,一旦遇到轉(zhuǎn)盤式路口的時(shí)候,更復(fù)雜的轉(zhuǎn)向恐怕會(huì)更讓車子規(guī)規(guī)矩矩地等了。

而在研究人員的實(shí)驗(yàn)中,也涉及了這方面的東西。實(shí)驗(yàn)證明,該機(jī)器人可以捕捉到周圍車輛的通行信息并進(jìn)行預(yù)測,然后做出合適的路線規(guī)劃。甚至其還意識(shí)到了不同的駕駛?cè)藭?huì)有或緩和或激烈的行車風(fēng)格,從而做出不同的規(guī)劃。

簡單來說,它可以讓車輛不再永遠(yuǎn)禮讓他人,而是瞅準(zhǔn)機(jī)會(huì)一把通過。

如果足夠精準(zhǔn)的話,自動(dòng)駕駛汽車過轉(zhuǎn)盤可能比人類司機(jī)還要好,畢竟人也會(huì)猶豫,而機(jī)器則是不會(huì)猶豫的。

或許更精準(zhǔn)的雷達(dá)、傳感器探測也會(huì)有助于解決這個(gè)問題,但開發(fā)個(gè)模型進(jìn)行訓(xùn)練和花費(fèi)巨大的成本提升探測精度比較起來,誰更劃算自然是不言自明。

當(dāng)然,該模型也并不是萬能的,其應(yīng)用范圍局限于較短距離的路徑,如果達(dá)到幾百米甚至以公里計(jì),那還是衛(wèi)星導(dǎo)航更靠譜點(diǎn)。

動(dòng)態(tài)取勝,或是成敗關(guān)鍵

模型除了不是萬能的,也還有一些問題是需要切實(shí)注意的。

首先,這個(gè)世界就是靜態(tài)和動(dòng)態(tài)的結(jié)合。顯然,在處理靜物的時(shí)候,它是沒有什么問題的,連傳統(tǒng)家用機(jī)器人都可以處理,無非就是個(gè)高精度(也許高精度都用不了)的傳感器的事兒。而研究人員的想法也顯然并不是讓它在一篇靜謐和諧的環(huán)境中去工作,而是在動(dòng)態(tài)之中獲得生存之道。

在自動(dòng)駕駛中的應(yīng)用就是該研究的出發(fā)點(diǎn)之一。應(yīng)對(duì)動(dòng)態(tài)的車流、人流本身就是自動(dòng)駕駛的一個(gè)巨大考驗(yàn),更何況要在這樣動(dòng)態(tài)的過程中尋找一個(gè)最佳的路線,這本身就是很難解決的事情。

比如說自動(dòng)駕駛車從轉(zhuǎn)盤的第二出口駛出,而這時(shí)在它的右方有要前往第三出口的車輛,那它該如何選擇?在那一瞬間,它要判斷幾個(gè)方面的因素:自身位置與第二出口車道的距離;其他一輛或者多輛汽車各自的時(shí)速、駕駛風(fēng)格等;然后設(shè)計(jì)出自己安全駛離轉(zhuǎn)盤同時(shí)又避免與其他車輛相撞的最佳路線,一次成功。

因?yàn)橹荒芤淮纬晒Γ吘共荒芟裨鹿鈱毢心菢幼惨幌挛覀兓氐介_始再撞一下,直到試錯(cuò)成功吧?

所以,如何開發(fā)優(yōu)秀的算法來對(duì)動(dòng)態(tài)的環(huán)境做精準(zhǔn)的判斷,是這項(xiàng)技術(shù)的關(guān)鍵內(nèi)容。

另一方面,該模型的工作方式其實(shí)并未脫離決策樹算法。也就是說,作用到機(jī)器人的身上,其實(shí)是由兩套決策。一個(gè)是由神經(jīng)網(wǎng)絡(luò)做出,當(dāng)其根據(jù)已有的訓(xùn)練對(duì)前方的位置通行做出一個(gè)較高的預(yù)測值的時(shí)候,機(jī)器人就聽神經(jīng)網(wǎng)絡(luò)的;當(dāng)神經(jīng)網(wǎng)絡(luò)給出的預(yù)測值較低,也就是可能無法做出準(zhǔn)確判斷的時(shí)候,機(jī)器人還是采用的決策樹的方法,慢慢試錯(cuò)著來……

這當(dāng)然是可以理解的,甚至兩種方法結(jié)合的方式可能會(huì)永遠(yuǎn)存在下去。而在這個(gè)過程中應(yīng)有的變化則是,神經(jīng)網(wǎng)絡(luò)的依賴權(quán)重逐漸增加,決策樹最終退化到僅僅是作為保障萬一之用。

顯然,目前來說,決策樹算法還是有很重要的作用的。

如果這個(gè)模型最終真的可以成熟地應(yīng)用到實(shí)際當(dāng)中,我們將很有可能看到行動(dòng)更加自如的機(jī)器人:自如掃地、自如穿行馬路、自如過轉(zhuǎn)盤……我們的生活,也可能會(huì)因此變得更加自如。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-10-09
面對(duì)陌生環(huán)境,機(jī)器人如何像人一樣自由穿行?
對(duì)移動(dòng)式工作的機(jī)器人來說,如何判斷周邊環(huán)境的安全,以保證暢通無阻是非常重要的。還沒動(dòng)兩步就“咣咣”碰壁,這樣的機(jī)器人就太尷尬了。 典型的是掃地機(jī)器人。

長按掃碼 閱讀全文