北京時間1月2日早間消息,加州大學伯克利分校的最新研究成果顯示,機器人也可以具備“預見”功能,通過視頻識別技術(shù)在移動物體之前預測到可能發(fā)生的情況。
人類有能力在采取行動之前首先進行思考。例如,如果有人想踢球,可能就會考慮球會跑到那里去,以及把球踢到新位置的概率。機器人往往不具備這種能力,因為它們內(nèi)部的程序通常只能執(zhí)行簡單的任務,沒有配備人工智能程序的機器人尤其如此。
但加州大學伯克利分校的研究人員卻發(fā)現(xiàn),機器人也可以具備這種直覺。為了證明這一點,他們開發(fā)了新的機器人學習技術(shù),使得機器人可以提前思考,以便“搞清楚如何操縱他們之前從未碰到過的物體?!?/p>
該團隊將這項技術(shù)稱作“視覺遠見”,但這并不表示機器人具備預測未來的能力——至少目前沒有。
伯克利的研究人員將這項技術(shù)應用到一臺名為Vestri的機器人身上,使之可以預測機器人的攝像頭幾秒種后能夠看到的內(nèi)容。具備了新的“遠見”后,Vestri便可在不觸碰附近其他物體的情況下,在桌子上移動各種小物體。最令人驚訝的是,這項技術(shù)還能讓機器人在沒有人類指導和監(jiān)督,也沒有物理知識的情況下,完成這些小任務。
“跟我們在環(huán)境中采取行動的方式一樣,這種方法也能讓機器人對不同行為如何影響周圍的世界進行視覺化?!辈死姍C工程和計算機科學系助理教授賽季·萊文(Sergey Levine)說,“這就能在復雜的現(xiàn)實環(huán)境中對高度靈活的技能展開智能規(guī)劃。”
“視覺遠見”的基礎是“卷積循環(huán)視頻預測”,或稱動態(tài)神經(jīng)平流(DNA)。該團隊表示,基于DNA的模型可以根據(jù)機器人的行為,預測圖像中的像素如何從一幀跳入另外一幀。作為萊文實驗室的博士生兼最初的DNA模型的發(fā)明人,切爾西·菲恩(Chelsea Finn)解釋道,像Vestri這樣的機器人現(xiàn)在可以“完全靠自己來掌握一系列視覺對象操控能力”。
萊文實驗室的費德里科·艾伯特(Frederik Ebert)則將這種機器人的運作方式與人類在其所處環(huán)境中與物體的互動方式進行對比:
“通過一生當中與各種物體的數(shù)百萬次互動,人類便可在沒有老師的情況下學會操控物體的技巧?!卑卣f,“我們已經(jīng)證明,完全有可能開發(fā)一套機器人系統(tǒng),利用大量自動收集的數(shù)據(jù)來學習可以廣泛使用的操控能力,尤其是推動物體的能力?!?/p>
萊文指出,Vestri的能力仍然存在一些局限,但他們將會采取更多措施來改進這項技術(shù)。有朝一日,這種技術(shù)或許可以對無人駕駛汽車起到幫助,使之更好地應對新的環(huán)境和不熟悉的物體。
但這項技術(shù)還需要很多改進才能實現(xiàn)這一目標,例如吸收更多經(jīng)過提煉的視頻預測和方法。
今后的機器人或許可以借助類似的技術(shù)完成更加復雜的任務,例如拿起和放置物體,或者處理衣服或繩子等柔軟且容易變形的物體。照此推測,洗衣機有朝一日或許還能額外配備疊衣服功能。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )