2020年5月31日,美國蘭德公司發(fā)布《通過機器學習實現(xiàn)空中優(yōu)勢:對人工智能輔助任務規(guī)劃的初步探索》(Air Dominance Through Machine Learning:A Preliminary Exploration of Artificial Intelligence–Assisted Mission Planning)研究報告,該研究為人工智能原型系統(tǒng)在空戰(zhàn)環(huán)境中開發(fā)和評估新型作戰(zhàn)概念的潛力提供了證據(jù)支撐。
蘭德公司《通過機器學習實現(xiàn)空中優(yōu)勢:對人工智能輔助任務規(guī)劃的初步探索》報告封面
該報告是蘭德公司在美國防部提供給其所屬聯(lián)邦資助的研發(fā)中心的資金支持下完成的(美國蘭德公司圖片)研究團隊測試了幾種學習技術和算法來訓練能夠在模擬環(huán)境中進行空戰(zhàn)規(guī)劃的智能代理,目標是利用人工智能系統(tǒng)的能力大規(guī)模地反復模擬和持續(xù)改進,從而加速并豐富作戰(zhàn)概念的發(fā)展。報告指出,人工智能任務規(guī)劃工具相比現(xiàn)有的人工或自動規(guī)劃技術將具有極大的速度優(yōu)勢。
蘭德公司在《通過機器學習實現(xiàn)空中優(yōu)勢:對人工智能輔助任務規(guī)劃的初步探索》報告中采用的研究技術路線(美國蘭德公司圖片)
作者觀點:該研究最大的目的是在簡化的仿真模擬環(huán)境中驗證人工智能系統(tǒng)進行空戰(zhàn)任務規(guī)劃進而創(chuàng)新戰(zhàn)法的應用潛力,值得關注的亮點和結論有:
1)假想的場景是給定一組配置不同傳感器、武器、誘餌和電子戰(zhàn)載荷的無人機對孤立防空體系進行進攻,場景的選取貼合蜂群、“馬賽克戰(zhàn)”等的基本構想;
2)將開源深度學習框架與國防部標準作戰(zhàn)模擬工具“仿真、集成與建模高級框架”(AFSIM)集成,分別測試了生成對抗網(wǎng)絡(GAN)、Q學習、異步優(yōu)勢動作評價(A3C)、近端策略優(yōu)化(PPO)等當前最新的開源算法,結果顯示只有PPO算法可以在一組變化的復雜場景下滿足任務規(guī)劃需求;
3)人工智能算法在任務規(guī)劃中展現(xiàn)了一定優(yōu)勢和潛力,倘若在算法、訓練和部署中進一步深化研究,有望在速度上相比現(xiàn)有的人工或自動任務規(guī)劃帶來巨大優(yōu)勢;
4)強化學習是在數(shù)據(jù)資源稀缺情況下利用人工智能實現(xiàn)作戰(zhàn)概念和戰(zhàn)術創(chuàng)新最有力的工具,回報函數(shù)的設置是決定人工智能演進策略的關鍵所在,是作戰(zhàn)智慧的核心涌現(xiàn);
5)在真實場景和關鍵任務中使用基于統(tǒng)計學習方法的人工智能系統(tǒng)必須經過充分的試驗、測試和認證。因此必須重視和加快航空可信人工智能框架方面的工作,其重要性不亞于其他航空人工智能應用探索工作。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )