手机在线中文字幕播放,青娱乐首页分类

7月4日- 5日，2018百度AI開發(fā)者大會在北京國家會議中心隆重舉行，大會上展示了眾多落地化成果。此次大會上百度首次舉辦AI設計論壇，百度設計體驗委員會主席、百度人工智能交互設計院院長、百度用戶體驗中心總經理關岱松及設計團隊分享了百度在AI設計和用戶體驗方面的經驗及思考，共同交流AI智能美學及創(chuàng)意等方面的最前沿發(fā)展。論壇上百度與湖南大學的戰(zhàn)略合作正式啟動，整合百度在AI交互設計領域的優(yōu)勢和湖南大學先進的科研能力，雙方將共建聯(lián)合創(chuàng)新實驗室及博士后基地，在AI設計領域進行更多更有價值的合作與探索。

DuerOS是以語音技術為基礎的對話式人機交互系統(tǒng)。通過萬物互聯(lián)、本能交互、千人千面三個方面構建了人機之間的新交互模式，使得設備能夠主動適應外界變化提供更好的信息服務，讓人機交互像人人交互一樣親切和富有情感，打造出用戶體驗最舒適的人機交流方式。

以下為演講實錄：

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【子軒】：大家好!我是百度體驗架構師周子軒，我今天要為大家分享的主題是《智慧型人機對話設計》。

大家知道最早的人機對話設計是什么時候開始的嗎?1952年，貝爾實驗室剛開始研究語音合成，把阿拉伯數(shù)字對它說，它直接能轉換出來。直到上周，我也都是這么認為的。

一周前的晚上，我跟小度小度說了一件事，『小度小度，你給我講個故事』你們猜小度講了什么?

【麗川】魔鏡魔鏡，告訴我，誰才是世界上最美麗的女人?

【子軒】魔鏡才是最早的帶屏音箱!但是魔鏡從設計角度講不夠聰明，不夠有智慧?；屎笙肼牭牟皇沁€有白雪公主漂亮，而且想要有人夸她。反正小度不會這么說，

為了研究這個話題，這就是我們今天想要分享智慧型人機對話設計,下面有請皇后的扮演者百度DuerOS體驗架構師張麗川。

【麗川】我是一名DuerOS的設計師，來跟大家分享最下最近幾個月，我們在對話式交互上的探索。其實對話有著悠久的歷史，在古代沒有書本的時候，孔子等古今中外的哲學家們就是使用對話去教學和傳播思想。那么我們今天致敬經典，用對話形式來講一講智慧型人機對話設計。

【子軒】麗川，你能說說DuerOS是什么嗎?

【麗川】DuerOS是一個搭建在AI浩瀚的技術上、以對話為統(tǒng)一用戶入口的、能實現(xiàn)承接多種第三方功能的系統(tǒng)級產品。

【子軒】那就是說，變得簡單了，喚醒它，然后等待你的需求。但是還是不夠智慧，魔鏡至少還能告訴我……

【麗川】沒錯，魔鏡其實是一個比較會讀心的設備。因為，語音并不等于對話。發(fā)出聲音其實只是其中的第一步，還需要對環(huán)境場景上下文的理解，充分獲取顯性和隱性的表達，和對人心理互動的把握，從而才能建立起良好的對話關系。

作為DuerOS的設計師，在領落到對話式人機交互的深意后，把更真實的自然還給用戶，把推理運算、歸納演繹等高級綜合能力裝在設備里。讓人感受到與ta互動的對象，不僅僅是一個聯(lián)網的智能設備，更是一個有智慧的對話對象。這就是我們提出的智慧型人機對話基本模型。

【子軒】那我想先了解下你說的環(huán)境是什么意思?

【麗川】我們想傳遞出的是重組人與環(huán)境的適應關系。所以，我們現(xiàn)在要提的一個概念是，從用戶主動設置到環(huán)境主動調整。首先，現(xiàn)在感應設備技術已經升級到一定程度，已經可以檢測距離、光線、音量、人臉、動作、溫度、濕度等等。通過感應器采集過來的信息形成信息空間，他是除了人類社會和物理空間之外的第三空間。國務院下發(fā)的《新一代人工智能發(fā)展規(guī)劃》中也強調了這一空間的建設和使用?；貧w到家居環(huán)境，DuerOS和萬物對話，我們擁有關于一個環(huán)境里的各方面信息，這些正是可以讓環(huán)境適應適應人的基礎。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【子軒】那么環(huán)境適應人真的可以去實現(xiàn)了啊?

【麗川】環(huán)境適應人分成三個進階。第一個是自動調整環(huán)境，第二個是響應人體變化，第三個是學習人的習慣。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【子軒】第一個是能夠根據(jù)干濕度來調整我適應我嗎?

【麗川】這是溫度和濕度的自動調節(jié)。對于人體最合適的溫度和適度已經有成熟的模型，把這個模型輸入到設備當中。當設備感受到人在家里的時候，就自動把家居環(huán)境調整到最適宜的狀態(tài)。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【子軒】第二點是響應人體變化怎么理解呢?

【麗川】隨著對話式交互的時代的到來，我們和設備的距離拉開，甚至到一個想遠就遠，想近就近的360度空間范圍里。所以，我們提出了在不同距離下最佳視覺呈現(xiàn)解決方案。他落地形態(tài)比如直觀的有字號、字體、排版、圖文比，間接的有信息量的重構。

下面講一下適應人的習慣。剛才我們展示了很多模型，但是這種模型是對于大部分人來說的，對于個人來說，是有自己的個性喜好的。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【子軒】這個場景我很熟悉，我在家做家務的時候就會調大音量……

【麗川】有了技術與環(huán)境場景更好的交融之后，人與設備的交流，才能更加細分場景與人交流方式的關系，回歸人體真正的自然交流方式。經過認知科學的研究發(fā)現(xiàn)，人們其實是使用多通道的方式去表達信息的。人本身就是多感官的，每個感官都能傳遞信息。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【子軒】什么叫做多通道呢?

【麗川】通俗一點講，就像當前我倆的對話，除了我們字面表達的文字內容之外，還有手勢，還有眼神，還有表情，還有語氣語調，這些加在一起，才完整的去表達了信息。

再細分下去，每個通道有ta傳遞信息的特點，也有傳遞信息的上限。所以，多通道整合的交互，才是最自然的，效率最大，更適合于多任務并行。

不過，多通道這個詞也提出來很多年了，但是以前的產品設計上只是用于代替手指的部分指令，比如指紋支付，指紋解鎖，人臉解鎖。這種是拆分開的。

而真正的多通道交互應該是整合在一起的，共同去傳遞信息，完成操作任務。

【子軒】這個我認同，人最早去適應機器……，教人學電腦還是一份職業(yè)，現(xiàn)在看來，這一刻真的到來了

【麗川】多通道表達信息的設計就是要去細分場景和操作任務。查閱相關資料發(fā)現(xiàn)，表達的通道和任務有指派性和互補性的特點。指派性也就是唯一性。是指某些任務下，有些任務是有最佳最優(yōu)勢的表達通道的。這時候未必是語言或手指或眼神，可能還是一個動作，比如手勢靜音。

像這樣的方案，只要用戶知道設備支持這樣的操作，對他來說是沒有學習成本和回憶成本的。

比如互補性，當單個通道不能充分表達信息時，需要其他通道補充，才能表達地更精準。經過多通道的同時表達，可以讓每個通道表達的信息更少，而合起來的意義更明確。

AI交互設計院的同事，會有意識地去采集這些手勢集合，把我們最自然的交互還原出來。這些集合的采集，在東方內斂含蓄文化下，真的很有意義。

【子軒】

人其實一直都有心理活動，并且會通過情緒，情感去表達出來。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【麗川】也有更多的網友會去自己設計表情包，表達更多無以名狀的情感。但是設備和技術的限制，只能在這個層面上?，F(xiàn)在小度也能覺察人的心理活動了。這里要提一個概念是模式匹配。

AI發(fā)展幾十年，從未有像現(xiàn)在，讓人充滿信心。因為現(xiàn)在大數(shù)據(jù)、深度學習、感應器、情緒理論模型等的高能加持，AI已經從單純的仿生，進化成模式匹配，這為我們去做更復雜的情感識別與鑒定打下了基礎。

最基礎的可以匹配的模式就是，人的心理活動三要素，知覺、情感、意志。三者之間是遞進推導關系，也是反向影響關系。

以嬰兒這個群體舉例，表達很直接，情緒很明顯，意圖很明確。采用遞進式的推進，可以快速定位他們的核心意圖。

老人這個群體，表達很含蓄，情緒很內斂，意圖卻很簡單。當老人對一個智能設備開口說出請求時，這不僅僅是請求的內容這么簡單，還代表這他們對新科技的向往，不想落伍的倔強，或者和自己兒女想要有共同的語言。把高科技信息以更有好的方式展示給老人，是對老人感官能力退化之后的無助感的關懷。

真正有智慧的個體，是當你還沒開口就知道你想要什么，俗話說的，很有靈性。通過一個人的表現(xiàn)，推測ta的意圖，通過情緒感知再去細化意圖，給予更深的解讀。

【子軒】這個怎么說，有什么產品嗎?

【麗川】這個還真有，我們正在設計一個自動伴唱功能。在播放歌曲的時候，察覺你在跟唱，那么就會切入一個模式，去掉原生，放伴奏歌曲，一秒進入K歌環(huán)節(jié)。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

【子軒】這真是一個激動人心的時代。我們用最自然的方式和一個智慧的對象對話，滿足我們不同的生活訴求。

DuerOS設計團隊真的是太體貼，太貼心，太專業(yè)了。麗川，你一定是小度吧，我問了你這么多問題，都很有條理的回答我了。

【麗川】你才是小度呢～未來的小度，其實就像是你這樣自然的與人交談，像我的朋友，能很好的傾聽，總結!

【子軒】讓我們共同期待DuerOS 設計團隊給大家?guī)砀嗟牧己玫捏w驗，讓我們共同期待智慧型人機對話交互時代的到來!

免責聲明：本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網站出現(xiàn)的信息，均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時，應及時向本網站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后，將會依法盡快聯(lián)系相關文章源頭核實，溝通刪除相關內容或斷開相關鏈接。

探索語音為主的多通道交互 DuerOS設計最舒適的人機交流方式

下一篇