国产成人久久精品二三区麻豆,青青青国产在线观看免费

研究人員開(kāi)發(fā)出新算法，像訓(xùn)練狗一樣訓(xùn)練機(jī)器人

人閱讀

2018-02-08 00:00:00

來(lái)源：機(jī)器人視界
相關(guān)關(guān)鍵詞
- 人工智能
- AI

美國(guó)陸軍研究實(shí)驗(yàn)室（ARL）和德克薩斯大學(xué)（UT）奧斯汀分校的研究人員已經(jīng)開(kāi)發(fā)了新的機(jī)器人或計(jì)算機(jī)程序技術(shù)，以學(xué)習(xí)如何通過(guò)與人類(lèi)指導(dǎo)員進(jìn)行交互來(lái)執(zhí)行任務(wù)。這項(xiàng)研究的結(jié)果于2月2日至7日在路易斯安那州新奧爾良的人工智能促進(jìn)協(xié)會(huì)論壇上公布。

ARL和UT研究人員考慮了一個(gè)特定的情況，即人以評(píng)論的形式提供實(shí)時(shí)反饋。奧斯汀得克薩斯大學(xué)的合作者Peter Stone博士和他的前博士生Brad Knox首先研發(fā)的TAMER，或者通過(guò)評(píng)估強(qiáng)化手動(dòng)培訓(xùn)機(jī)器人人，由ARL/UT團(tuán)隊(duì)開(kāi)發(fā)了一種新的算法叫Deep TAMER。

這是TAMER的擴(kuò)展，采用深度學(xué)習(xí)，它的靈感來(lái)源于人類(lèi)的大腦，讓機(jī)器人可以獲得通過(guò)短時(shí)間觀看視頻來(lái)獲得執(zhí)行任務(wù)的能力。

據(jù)軍方研究員Garrett Warnell博士表示，研究小組認(rèn)為，一個(gè)人通過(guò)觀察和提供評(píng)論（例如，"好工作"或"糟糕的工作"）來(lái)教導(dǎo)機(jī)器人如何做事，就像人類(lèi)訓(xùn)練狗去變戲法一樣。Warnell說(shuō)，研究人員延伸了這個(gè)領(lǐng)域的早期工作，使這種類(lèi)型的機(jī)器人或計(jì)算機(jī)程序的培訓(xùn)，通過(guò)圖像看世界，這是設(shè)計(jì)可以在現(xiàn)實(shí)世界中運(yùn)行的學(xué)習(xí)代理的重要第一步。

目前人工智能中的許多技術(shù)要求機(jī)器人在較長(zhǎng)的時(shí)間內(nèi)與環(huán)境進(jìn)行交互，以學(xué)習(xí)如何最佳地執(zhí)行任務(wù)。在這個(gè)過(guò)程中，機(jī)器人人可能會(huì)執(zhí)行一些不僅可能是錯(cuò)誤的行為，例如機(jī)器人在墻上跑步，而且可能會(huì)發(fā)生像機(jī)器人跳下懸崖等災(zāi)難性的事故。Warnell表示，來(lái)自人類(lèi)的幫助將加快機(jī)器人的成長(zhǎng)速度，并幫助他們避免潛在的陷阱。

作為第一步，研究人員展示了Deep TAMER的成功，通過(guò)15分鐘的人為反饋來(lái)訓(xùn)練代理人在Atari保齡球游戲中比人類(lèi)更好的表現(xiàn)，這個(gè)任務(wù)對(duì)于即使是最先進(jìn)的人工智能方法而言也是非常困難的。Deep-TAMER訓(xùn)練的機(jī)器人展示出了過(guò)人的表現(xiàn)，甚至優(yōu)于他們的業(yè)余訓(xùn)練師以及專(zhuān)家級(jí)人類(lèi)Atari玩家。

左：ARL的研究員Garrett Warnell博士，右：德克薩斯大學(xué)（UT）奧斯汀分校教授Peter Stone博士

在未來(lái)一到兩年中，研究人員有興趣探索他們的最新技術(shù)在更廣泛的環(huán)境中的適用性：例如除了Atari Bowling以外的視頻游戲和更多的仿真環(huán)境，為真實(shí)世界中的機(jī)器人找到更好類(lèi)型的代理和環(huán)境。

Warnell表示，"未來(lái)的軍隊(duì)將由士兵和自主隊(duì)友并肩作戰(zhàn)，盡管人類(lèi)和自主機(jī)器人都可以提前接受培訓(xùn)，但他們有可能在完全陌生的新環(huán)境中執(zhí)行搜索、營(yíng)救或監(jiān)視等任務(wù)，在這種情況下，人類(lèi)可以很好地利用訓(xùn)練隨機(jī)應(yīng)變，而現(xiàn)在的人工智能機(jī)器人還做不到。"

Deep TAMER是研究人員設(shè)想的一系列研究的第一步，將使陸軍中更加成功的人類(lèi)-自主機(jī)器人團(tuán)隊(duì)成為可能。最終，他們需要自主的機(jī)器人人，能夠以各種各樣的形式，如演示、自然語(yǔ)言指導(dǎo)和評(píng)論，快速而安全地從他們的人類(lèi)隊(duì)友學(xué)習(xí)。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。）