從人機(jī)共生體的視角,重新理解機(jī)器人產(chǎn)業(yè)方法論

原標(biāo)題:從人機(jī)共生體的視角,重新理解機(jī)器人產(chǎn)業(yè)方法論

提到機(jī)器人,大家腦海中第一時(shí)間會(huì)浮現(xiàn)出怎樣的事物?

大概率情況下,要么是工業(yè)級(jí)/服務(wù)級(jí)機(jī)器人,以機(jī)械臂、簡(jiǎn)單驅(qū)動(dòng)型為主角,不講究外形美觀,動(dòng)作也往往不怎么連貫,常常被冠以“人工智障”的美稱;

要么則是仿人機(jī)器人,它們總是出沒在伯克利或波士頓動(dòng)力等高大上的實(shí)驗(yàn)室里,能夠以七十二般武藝讓人類忍不住發(fā)出“滅絕警告”,但必需的編程和持續(xù)作業(yè)能力,以及技能的泛化程度,卻都達(dá)不到大規(guī)模應(yīng)用的可能。

人與智能機(jī)器之間,有沒有第三種可能呢?

其實(shí)早在1960年,約瑟夫·利克萊德(J. C. R. Licklider)就曾提出了一個(gè)觀點(diǎn)——人機(jī)共生(Man-computer symbiosis)。

簡(jiǎn)單來說,就是人類和電子設(shè)備以親密合作的方式生活在一起,甚至結(jié)成緊密的聯(lián)盟。兩者的結(jié)合,可以創(chuàng)造一種高產(chǎn)且生機(jī)勃勃的合作關(guān)系。

“人類機(jī)器命運(yùn)共同體”,聽起來是不是很心動(dòng)?可惜的是,目前目前還很少見到人機(jī)共生體(man-computer symbioses)的出現(xiàn)。所以,最近中國機(jī)器人產(chǎn)業(yè)中出現(xiàn)的“發(fā)球機(jī)器人”,就引起了我們的注意。

原因無他,這或許是人機(jī)共生“星星之火”燎原的起點(diǎn)。

點(diǎn)燃人機(jī)共生的星火:發(fā)球機(jī)器人的初蹄

首先有必要解釋一下,為什么說發(fā)球機(jī)器人,體現(xiàn)出了“人機(jī)共生”的現(xiàn)實(shí)趨勢(shì)。

這款發(fā)球機(jī)器人,起源于新松機(jī)器人與乒乓球?qū)W院一次偶然的談話。

當(dāng)前的乒乓球運(yùn)動(dòng)存在一些亟待解決的問題:

一是效率。助教為專業(yè)運(yùn)動(dòng)員喂球時(shí),往往在速度、旋轉(zhuǎn)、落點(diǎn)控制、頻率等方面,難以達(dá)到高水平選手的訓(xùn)練需求;

二是統(tǒng)一。一旦助教出現(xiàn)疲憊、狀態(tài)不佳等情況,就會(huì)直接影響速度、旋轉(zhuǎn)等參數(shù),影響訓(xùn)練特定技戰(zhàn)術(shù)動(dòng)作的一致性,運(yùn)動(dòng)員很難形成最佳的肌肉記憶;

三是反饋。乒乓球是一項(xiàng)實(shí)時(shí)性非常高的運(yùn)動(dòng),往往一秒之間幾個(gè)來回,過快的球速與落點(diǎn)的不確定性,也導(dǎo)致教練往往只能憑借經(jīng)驗(yàn)來反饋,很難通過量化來優(yōu)化教學(xué),一些特定動(dòng)作也就無法有效分析和復(fù)現(xiàn)。

四是普及。乒乓球的另一個(gè)身份是“國球”,中國有眾多的愛好者和青少年參與到這項(xiàng)運(yùn)動(dòng)中來,但不同地域、不同水平的教練卻參差不齊,自然也就無法滿足更多人群享受乒乓球這項(xiàng)運(yùn)動(dòng)的愿望。

能不能通過智能技術(shù)的引入,來解決上述問題呢?

深耕深度學(xué)習(xí)算法的龐伯特,就以新松的機(jī)器人研發(fā)技術(shù)和中國乒乓球?qū)W院的海量專業(yè)數(shù)據(jù)和課程,研發(fā)出了可以自主決策的人工智能發(fā)球機(jī)器人。

而讓龐伯特機(jī)器人得以勝任發(fā)球工作的幾大核心:

首先是感知。通過高速雙目立體視覺系統(tǒng),機(jī)器人能夠捕捉高速運(yùn)動(dòng)下的乒乓球位置,并形成球的軌跡,通過軌跡分析,在毫秒內(nèi)判斷球速以及球的旋轉(zhuǎn)方向,讓乒乓球技術(shù)轉(zhuǎn)化為可視的數(shù)據(jù),實(shí)時(shí)調(diào)整,精準(zhǔn)化訓(xùn)練。

其次是決策:在軌跡分析的基礎(chǔ)上,龐伯特同時(shí)對(duì)人體動(dòng)作進(jìn)行捕捉,通過與預(yù)設(shè)的動(dòng)作角度進(jìn)行比對(duì),分析運(yùn)動(dòng)員動(dòng)作是否到位。結(jié)合軌跡和動(dòng)作兩個(gè)因素,判斷運(yùn)動(dòng)員的水平,推薦課程。對(duì)于個(gè)人愛好者來說,相當(dāng)于擁有了一個(gè)專業(yè)教練+陪練。

再次是運(yùn)動(dòng)。龐伯特機(jī)器人具有類人化結(jié)構(gòu),不同于市面上以擠壓方式進(jìn)行發(fā)球的設(shè)備,龐伯特能夠高度模擬類人化的發(fā)球方式,模擬人類發(fā)球時(shí)對(duì)球方向和旋轉(zhuǎn),實(shí)現(xiàn)兩跳發(fā)球。而利用不同的球拍膠面,還能打出不一樣的球,這些都能更好地輔助人類運(yùn)動(dòng)員進(jìn)行訓(xùn)練。

顯然,龐伯特機(jī)器人正在將技術(shù)思維(technical thinking)與人類智慧相結(jié)合,為人機(jī)共生打開了新的窗口。

逃離恐怖谷:發(fā)球機(jī)器人昭示三重改變

從龐伯特機(jī)器人的實(shí)踐中不難看出,如果在人和機(jī)器之間建立共生關(guān)系,那么二者的合作互動(dòng)顯然會(huì)大大改善很多現(xiàn)有問題。

由此也可以總結(jié)出,共生型機(jī)器人與大眾常見的傳統(tǒng)機(jī)器人有何不同之處:

首先,盡管所有人造系統(tǒng)都是為了幫助人類,但傳統(tǒng)的自動(dòng)化機(jī)器人更多的是為了實(shí)現(xiàn)“人類增強(qiáng)”,而共生型機(jī)器人則是為了“與人類更好地生活在一起”。

還是以發(fā)球機(jī)器人為例,傳統(tǒng)的發(fā)球設(shè)備只是機(jī)械地?cái)U(kuò)展某項(xiàng)技能,比如取代人的手臂來進(jìn)行發(fā)球,往往需要人類助教來完成那些需要主動(dòng)決策、調(diào)整、制定標(biāo)準(zhǔn)等工作,在效率和功能上并沒有帶來質(zhì)的改變。

而龐伯特機(jī)器人的特殊之處,就在于通過深度學(xué)習(xí)算法的引入,在智能程度上賦予了機(jī)器人新的高度。比如實(shí)時(shí)高通量的數(shù)據(jù)收集與處理;高效精準(zhǔn)專業(yè)的預(yù)判決策;個(gè)性定制化的訓(xùn)練反饋與指導(dǎo);乒乓球運(yùn)動(dòng)的隨機(jī)性又要求算法具備一定的泛化能力和高魯棒性……這些都是龐伯特機(jī)器人能夠成為乒乓球運(yùn)動(dòng)伙伴的關(guān)鍵。

第二,共生型機(jī)器人必須具備可“實(shí)時(shí)”(real time)進(jìn)行的思考過程。

傳統(tǒng)的機(jī)器人可以根據(jù)預(yù)先設(shè)定的程序處理數(shù)據(jù)。比如餐廳服務(wù)機(jī)器人,輸入店內(nèi)地圖、設(shè)定好傳送菜程序之后只能按部就班地工作,有的甚至連避讓行人都做不到,因?yàn)樘崆霸O(shè)定會(huì)導(dǎo)致一旦出現(xiàn)不可預(yù)見的情況,整個(gè)過程就會(huì)停止。

但球類運(yùn)動(dòng)可不一樣,乒乓球的高速運(yùn)動(dòng)需要發(fā)球者做出毫秒級(jí)的判斷,像人一樣快速思考、分析、決策、反應(yīng)。對(duì)于人類來說都可能要靠直覺來完成的事情,對(duì)機(jī)器與人之間的耦合要求要緊密的多。

讓機(jī)器能夠做出決策和控制復(fù)雜的情況,而不依賴于預(yù)先確定的程序,就是龐伯特機(jī)器人向我們展示的現(xiàn)實(shí)圖景。

最后,共生型機(jī)器人有機(jī)會(huì)重構(gòu)機(jī)器人行業(yè)的商業(yè)方法論。

長(zhǎng)期以來,傳統(tǒng)機(jī)器人市場(chǎng)的商業(yè)邏輯,要么是“人工+智能”,用真人來操控機(jī)器人模型,以達(dá)到模擬強(qiáng)人工智能的效果;要么是長(zhǎng)期砸錢在天頂技術(shù)上,比如波士頓動(dòng)力的機(jī)器人雖然炫酷,卻因商業(yè)化困難而賣身給軟銀。

但龐伯特機(jī)器人所代表的共生型機(jī)器人卻開啟了另一種模式,通過“真AI算法”+聚焦實(shí)用場(chǎng)景來切入市場(chǎng)。

我們注意到,除了發(fā)球機(jī)器人之外,龐伯特還打造了對(duì)打機(jī)器人。

將深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)相結(jié)合,讓對(duì)打機(jī)器人和發(fā)球機(jī)器人能夠通過大量復(fù)雜環(huán)境的交互,運(yùn)用各自的人工智能算法平臺(tái),不斷得到反饋,互相學(xué)習(xí)到新的技能與策略,機(jī)器人之間的對(duì)戰(zhàn)也能不斷提升算法模型的復(fù)雜度與智能度。

同時(shí),一旦高性能算法模塊被拼圖一樣使用,就能夠以低成本、小型化、高效率的方式快速打開市場(chǎng),未來不止于乒乓球這一項(xiàng)運(yùn)動(dòng),更多場(chǎng)景都可以通過軌跡分析、動(dòng)作分析、終端顯示等集成模塊帶來改變。

從這個(gè)角度看,龐伯特機(jī)器人正在重新確立人與機(jī)器、甚至是機(jī)器與機(jī)器的關(guān)系,即一種共生伙伴關(guān)系(symbiotic partnership)。在這一美好的畫面中,機(jī)器會(huì)為人類提供見解和決策,而人類則能更有效地進(jìn)行智力活動(dòng)與創(chuàng)造。

打開產(chǎn)業(yè)智能的價(jià)值圖景:挖掘人機(jī)共生的富礦

正如國際人工智能聯(lián)合大會(huì)前主席Francesca Rossi所說,人機(jī)共生是未來人類使用AI的最好方式。

那么,作為人類和機(jī)器的預(yù)期前景,其中是否也埋藏著商業(yè)價(jià)值的富礦呢?

答案是肯定的。

以龐伯特機(jī)器人為例,未來就有可能締造出不少新的產(chǎn)業(yè)機(jī)遇。

比如說,通過與海量運(yùn)動(dòng)員對(duì)戰(zhàn),發(fā)球機(jī)器人可以積累專業(yè)領(lǐng)域的數(shù)據(jù),不斷優(yōu)化算法,快速提升自身的擊打能力和策略,衍生出個(gè)性化的對(duì)戰(zhàn)方式,來幫助運(yùn)動(dòng)員更好地進(jìn)行訓(xùn)練。并將其輸出為可量化、可視化的訓(xùn)練標(biāo)準(zhǔn),讓乒乓球的專業(yè)教育門檻下沉到普通人生活當(dāng)中。

再比如,分析決策算法的持續(xù)迭代,有望推廣到新的運(yùn)動(dòng)和行業(yè)中去,以基礎(chǔ)化的能力支撐起千行萬業(yè)的智能化需求,成為“新基建”中不可或缺的一員。舉個(gè)例子,當(dāng)機(jī)器人與城市智慧健康系統(tǒng)結(jié)合,是否能夠作為市民健康的關(guān)鍵終端,來提供行而有效、可連可控的運(yùn)動(dòng)網(wǎng)絡(luò)呢?

從這個(gè)角度延展開來,龐伯特機(jī)器人不僅能夠輸出算法模塊,還能夠向其他行業(yè)輸出軟硬件合一的整體智能解決方案。通過算法、硬件、人的交互,完成一次人機(jī)共謀的大變革。

站在萬物智能、人機(jī)共生的起點(diǎn),不難預(yù)見人類和機(jī)器之間密切耦合的未來。與智能生命伙伴共舞,是人類必然的未來。而目睹了龐伯特機(jī)器人的我們,也正在經(jīng)歷種植AI的進(jìn)行時(shí)。

過去的數(shù)年間,讓深度學(xué)習(xí)擺脫需要大量輸入和人工的有監(jiān)督學(xué)習(xí),一直是人類研究者努力的方向,為此推動(dòng)了許多新的技術(shù)進(jìn)展,比如:

借助meta learning元學(xué)習(xí)算法,機(jī)器獲得了“泛化”,能夠舉一反三,學(xué)習(xí)協(xié)同性地處理多種任務(wù);

借助Reinforcement Learning強(qiáng)化學(xué)習(xí),機(jī)器懂得了“決策”,通過不斷地自我學(xué)習(xí)與回饋來抵達(dá)高級(jí)智能。

而這些能“擬人”的機(jī)器學(xué)習(xí)方法,也讓AI獲得了前所未有的能力,打敗柯潔李世石的DeepMind阿爾法狗、在DOTA2中團(tuán)滅人類電競(jìng)選手的OpenAI Five、自動(dòng)駕駛,乃至通用人工智能AGI,都是通過讓機(jī)器模仿人類對(duì)世界的認(rèn)知方式,以不斷探索、試錯(cuò)、改進(jìn)的方式,與環(huán)境進(jìn)行實(shí)時(shí)交互,進(jìn)而提高自己的能力。

天地有正氣,雜然賦流形。今天,龐伯特也試圖讓機(jī)器人“自行進(jìn)化”,啟動(dòng)了一場(chǎng)發(fā)球機(jī)器人教對(duì)打機(jī)器人打乒乓的“先鋒實(shí)驗(yàn)”。

通過兩臺(tái)機(jī)器人之間的相互“較量”,讓機(jī)器人身處在一個(gè)不可預(yù)期的環(huán)境中,依靠人工智能算法平臺(tái)主動(dòng)生成一些標(biāo)記和標(biāo)簽來做決策判斷,獨(dú)立解決多個(gè)非線性的邏輯問題,通過“行動(dòng)-評(píng)價(jià)”的強(qiáng)化學(xué)習(xí)機(jī)制來改進(jìn)自身,適應(yīng)新的環(huán)境,從而發(fā)展機(jī)器人間的校驗(yàn)標(biāo)準(zhǔn)。這會(huì)為成為機(jī)器人社會(huì)意識(shí)的起點(diǎn)嗎?

4-6月,龐伯特會(huì)在B站(@龐伯特)定期發(fā)布機(jī)器人課堂的實(shí)時(shí)動(dòng)態(tài),不妨和我們一起去圍觀吧。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-03-29
從人機(jī)共生體的視角,重新理解機(jī)器人產(chǎn)業(yè)方法論
深耕深度學(xué)習(xí)算法的龐伯特,就以新松的機(jī)器人研發(fā)技術(shù)和中國乒乓球?qū)W院的海量專業(yè)數(shù)據(jù)和課程,研發(fā)出了可以自主決策的人工智能發(fā)球機(jī)器人。

長(zhǎng)按掃碼 閱讀全文