前期回顧
作為人工智能的一個重要分支,認知體系的研究和應用經(jīng)過了近40年的發(fā)展,已取得了可見的成果。前兩期內(nèi)容對認知體系的概念、感知和注意力進行了介紹,本期將繼續(xù)分享關(guān)于行動選擇和記憶的部分。
摘譯:認知體系研究綜述(一)1 引言2 什么是認知體系3 認知體系的分類
摘譯:認知體系研究綜述(二)4、感知
5、注意力
6 行動選擇(Action Selection)
一般來說,行動選擇決定在什么時間要做些什么,被分為“做什么”(即做什么決策)和“怎樣做”(即動作如何控制)。例如,在MIDAS體系,行動選擇包含了目標任務和執(zhí)行這個選擇的動作或行動。同樣的,在MIDCA中,下一個動作通常是從一個被計劃好的序列中選擇出來的(如果這個序列存在的話)。因為在不同的認知體系中,行動選擇的方法是不同的。在接下來的討論中,行動選擇機制可應用于決策和動作。
圖7顯示了所有被執(zhí)行的行動選擇機制,根據(jù)相關(guān)的體系類型(符號、混合、涌現(xiàn))來組織。執(zhí)行行動選擇的主要兩種方式:計劃和動態(tài)。計劃是事先制定一系列的步驟以達到一個確定的目標。在動態(tài)的行動選擇中,一個最好的動作是從其他方案中被選擇出來的,基于當時可獲得的知識。對于這個類別,我們考慮選擇的類別(贏者通吃、概率、預定義)和選擇的標準(相關(guān)性、效用、感情)。默認選項一直是基于給定的標準做出的最好的動作(有最高激活水平的動作)。
最后,學習也可以影響行動選擇,但會在第8節(jié)中討論。注意,這些行動選擇機制并不互相排斥并且大多數(shù)體系中有不止一種機制。盡管很少的體系會執(zhí)行同樣的行動選擇機制,可行的組合空間通常會很大。
圖7:行動選擇所涉及的機制
圖7中可視化分為三列:符號、混合和涌現(xiàn)。注意,在這個圖中(以及第7節(jié)和第8節(jié)的圖中),排序順序強調(diào)具有相似動作的選擇機制(或分別為記憶和學習方法)的體系結(jié)構(gòu)簇。
6.1 計劃與反應式動作
可以預見的是,計劃型行動選擇在符號范式體系中更加常見,但是也能在一些混合的甚至是涌現(xiàn)范式體系中被發(fā)現(xiàn)。尤其是在任務分解中,當目標被遞歸地分解成子目標,任務分解是計劃動作的一種非常常見的形式。
其他被使用的計劃動作的類型有:暫時性的、連續(xù)性的、層級性任務網(wǎng)絡的、生成式的、基于搜索的、局部擇優(yōu)的等等。在我們的選擇中,很少有體系僅僅只依賴于計劃,例如OSCAR做邏輯推理和IMPRINT使用任務分解來模擬人類行動。除此之外,計劃型行動選擇經(jīng)常利用加強動態(tài)的行動選擇機制,來提升對變化的環(huán)境的適應性。
6.2 動態(tài)行動選擇
動態(tài)行動選擇能提供更多靈活性,并且能被用來模擬人類和動物?!摆A者通吃”是神經(jīng)網(wǎng)絡中的一種選擇策略(最強的輸入被增強而其余的被抑制),它和它的變異體在各種新興體系中很常見。同樣的機制也被用來在所有體系中尋找最適合的動作,通常行動是多個并行過程的合作和競爭的結(jié)果。
行動選擇的預定義序(方式)可能服務于不同目的。比如,在Subsumption體系中,機器人行動被附屬行動等級所表示,高級行動優(yōu)先于(包含)低級行動的輸出。
在FORR中,做決策的部分根據(jù)遞增順序來從顧問中考慮選項,以達到與人類成員類似的學習。在YMIR中,優(yōu)先級首先被給與到反應層中的過程中,然后是內(nèi)容層,再是過程控制層。這里,目的是提供一個平滑的實時行動生成。每層有一個不同的認知反應時間上限,因此,反應式模塊為用戶提供自動的反饋(變化的臉部表情、自動發(fā)聲),而審議性模塊生成更復雜的行動。剩余的行動選擇機制包含有限狀態(tài)機制,被經(jīng)常用來表示動作的順序甚至來編譯整個系統(tǒng)的行動,概率行動選擇也常見。
行動選擇標準
在選擇下一個動作時,有多個標準要被考慮到:相關(guān)性、效用和感情(包括動機、情感狀態(tài)、情緒、心情、積極性等)。
相關(guān)性反映出動作有多么契合現(xiàn)在的情況,這主要應用于有符號范式推理的系統(tǒng)和在應用前測試規(guī)則前/后的條件。動作的效用是測量為了達到現(xiàn)有目標的期望貢獻。一些體系也會執(zhí)行候選動作的“干運行(dry run)”,并觀察他們的效果來決定他們的效用。效用也會考慮到過去動作的表現(xiàn)并在將來通過強化學習來促進行動的成長。其他機器學習技術(shù)也可以被用來把過去的成功行動和目標做關(guān)聯(lián)。最后,內(nèi)部因素并不直接決定下一個行動,但是會使選擇存在偏差。
簡單來說,我們會考慮關(guān)聯(lián)到情緒、積極性和人類個性特征的短期、長期和終身因素?;谶@些因素對于人類的決策和其他認知能力的影響,在認知體系中模擬情緒和情感是重要的,特別在人機交互、社交機器人和虛擬代理的領(lǐng)域。
在認知系統(tǒng)中,人工感情通常被模擬成能夠影響認知能力的過度狀態(tài)。比如,在CoJACK中,斗志和恐懼的情緒能改變計劃選擇。在斗志高昂時,那些能應對威脅的計劃有更高的效用,但當恐懼時,效用低下。其他例子包括壓力影響決策的模型、影響21點策略的開心/悲傷情緒、在焦慮狀態(tài)下的類比推理、記憶喚醒的影響、基于目標滿意度的正面和負面情感、在HCI場景中的情緒學習等。
積極性是內(nèi)部動機的另一個源泉。一般來說,他們代表基本的生理需要,比如食物和安全,但也能包含高級和社交動機。在ASMO中,3種相關(guān)的簡單積極性,“喜歡紅色、用戶與機器人的贊美“,通過調(diào)整相關(guān)模塊的權(quán)重來做偏差行動選擇。在CHARISMA中,保存積極(避免傷害和饑餓)、好奇心和自我提升的欲望一起指導行動生成。在MACSi中,好奇心驅(qū)使代理,探索到它學習最快的領(lǐng)域。同樣,在CERA-CRANIUM中,好奇心、恐懼和生氣通過可移動的機器人來影響對環(huán)境的探索。
社交機器人Kismet的行動被3種適應性積極所影響:與人接觸、與玩具接觸以及休息。這些積極的外部事件會有助于機器人的情感狀態(tài)(情緒)和通過面部表情,站姿或聲音的語調(diào)來展示表情,比如生氣、惡心、恐懼、歡樂、悲傷和驚喜。與擁有過度本質(zhì)的情緒不同,性格特征是獨特的長期行動模式,通過一貫的偏好例如內(nèi)部動機,情緒,決策來展示。大部分的被識別的個性特征能被歸納到一個足夠廣泛定義人類個性的小的維度或因素集合里。
同樣的,認知系統(tǒng)里的個性經(jīng)常被多個因素和維度所代表。這些特征,反過來,和系統(tǒng)可能經(jīng)歷的情緒和積極性相關(guān)。在最簡單的案例中,一個參數(shù)就足以在系統(tǒng)行動中創(chuàng)建一個系統(tǒng)偏差。
NARS和CogPrime使用“個性參數(shù)”來定義需要多少證據(jù)來評價邏輯聲明的真實性或計劃下一個動作。參數(shù)的值越大,系統(tǒng)就更加“保守”。在Novamente中,一個虛擬動物的個性特征(攻擊性、好奇心、玩樂)通過概率規(guī)則與情緒狀態(tài)和動作相關(guān)聯(lián)。同樣的,在AIS特征中,下流、冷淡、害羞、自信、懶散,它們被賦予一個整數(shù)值來定義被展示的程度?;趥€性,抽象的規(guī)則能定義什么行動更有可能。在CLARION中,個性類型決定了很多預定義積極的基線強度和初始赤字。映像被包含在一個預訓練的神經(jīng)網(wǎng)絡中。
引人注目的是,這些簡單的模型甚至能生成一系列的個性。比如,Pogamut代理有9種可能的狀態(tài)和5種個性因素(基于FFM),能夠生成45種不同的映像,每種映像能夠不同程度地產(chǎn)生12 種預定義的意圖并生成廣泛的行動。CLARION 和MAMID值得特殊的關(guān)注。CLARION提供一個認知可信的框架,有能力處理情緒、積極性和個性特征,并把它們和其他包含決策的認知系統(tǒng)相關(guān)聯(lián)。
情緒的3個方面被模擬:反應式情感(情緒的潛意識經(jīng)歷)、審議性評估(可能有意識)和處理/動作(在評估之后)。因此,情緒以顯性和隱形過程的交互形式出現(xiàn)并包含(和影響)認知和動作。多個CLARION模型已經(jīng)被心理學數(shù)據(jù),F(xiàn)FM個性的計算機模型,用來處理校園霸凌,壓力下的表現(xiàn)退化和由社交焦慮所引起的成見偏差模型所驗證。
MAMID是一個由外部事件、內(nèi)部解釋、目標和個性特征所產(chǎn)生的生成與情緒效果的模型。在內(nèi)部,與信念網(wǎng)絡和任務標準、個體標準有關(guān),即目標失敗是否會導致在一個特殊的代理中出現(xiàn)焦慮。MAMID已經(jīng)在兩個領(lǐng)域被實例化了:保衛(wèi)和平的任務訓練和搜救任務。它對于情緒和設計的跨學科理論的貢獻也有很大的價值。
12下一頁>(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )