極客網(wǎng)·人工智能 8月28日訊,在AI領域中,有一種叫做“強化學習”的衍生項目,其原理是利用獎賞(或懲罰)來驅動代理朝著特定的目標前進,目前DeepMind就是利用這種學習方式AlphaGo。然而,作為新興事物的強化學習,其框架尚處于雛形,而且還在一定程度上缺乏人性化,例如用戶需要花很多時間來掌握一個目標,十分死板也不夠穩(wěn)定。
針對這種種問題,Google近日提出了一個關于“強化學習”的改善方案,那就是基于其機器學習庫TensorFlow的開源進行對學習框架的強化。據(jù)悉,該強化學習框架就靈活性、穩(wěn)定性和重現(xiàn)性三個核心原則進行開發(fā),目前它已在GitHub正式發(fā)布。
除了開源框架外,Google還做了一個網(wǎng)站,站內允許開發(fā)人員能快速將針對多個代理的培訓運行進行可視化。另外,該網(wǎng)站也可以它還提供經(jīng)過訓練的模型、原始統(tǒng)計日志和TensorFlow事件文件,這些功能還可以跟TensorBoard一起繪圖,而TensorBoard則是Google開發(fā)的用于TensorFlow程序的可視化工具套件。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )