近日,美圖公司社交產(chǎn)品事業(yè)群視覺算法組與清華大學自動化系智能視覺實驗室合作,推出了業(yè)界最大規(guī)模教程類行為數(shù)據(jù)集COIN(COmprehensive INstructional video analysis),該論文已被計算機視覺與模式識別會議CVPR 2019錄用。
?COIN數(shù)據(jù)集的概覽
教程類行為視頻(Instructional Video)可以幫助使用者獲取完成各種行為任務的知識,但是現(xiàn)有教程類行為視頻數(shù)據(jù)集在規(guī)模性和多樣性都存在較大的局限性,難以應用于現(xiàn)實生中的復雜場景。為此,美圖公司社交產(chǎn)品事業(yè)群視覺算法組與清華大學自動化系智能視覺實驗室合作提出了名為COIN的大規(guī)模教程類數(shù)據(jù)集,用于更全面的教程類行為視頻分析。
COIN數(shù)據(jù)集采用分層結(jié)構,即第一層是領域(Domain)、第二層是任務(Task)、第三層是步驟(Step),其中包含與日常生活相關的11827個視頻,涉及交通工具、電器維修、和家具裝修等12個領域的180個任務,共778個步驟。
COIN數(shù)據(jù)集的分層結(jié)構
COIN數(shù)據(jù)集的設計人員還開發(fā)了創(chuàng)新性的標注工具,可以更高效更準確地標注視頻行為的步驟信息。此外,為了給數(shù)據(jù)集提供更準確的基準指標,數(shù)據(jù)集開發(fā)人員還使用了SSN、R-C3D等評價方法對COIN數(shù)據(jù)集進行了測評。
?COIN數(shù)據(jù)集的步驟定位準確率分析
目前,COIN數(shù)據(jù)集是業(yè)界規(guī)模最大、多樣性最豐富的教程類視頻數(shù)據(jù)集。該數(shù)據(jù)集在標注結(jié)構上采用分層的組織結(jié)構,涵蓋了多種不同類型的教程類視頻。該數(shù)據(jù)集的提出,給復雜場景下視頻動作時序定位(temporal localization)等問題的研究提供豐富的數(shù)據(jù)資源,有望加快推動視頻行為分析與理解等相關領域的研究。
美圖公司社交產(chǎn)品事業(yè)群視覺算法組,是美圖社交化的重要算法團隊之一。隨著“美和社交”戰(zhàn)略的發(fā)布,美圖秀秀從過去的純圖片處理軟件轉(zhuǎn)變?yōu)樯鐓^(qū)平臺。視覺算法組通過人工智能/深度學習算法,理解圖像和視頻內(nèi)容中的語義信息,為社區(qū)中推薦、搜索、反作弊和垃圾過濾等提供有力的技術支撐。幫助用戶處理圖片的同時,增加社交功能及軟件活性。
- 馬蜂窩新思路:AI技術引領旅行社翻開流量新篇章
- 同程旅行創(chuàng)新升級:首家接入DeepSeek的程心大模型,探索智能旅行新篇章
- 曹操出行智行自動駕駛平臺蘇杭試運營:Robotaxi探索未來出行新篇章
- 2月3C數(shù)碼市場爆款頻出:國補推動下,國產(chǎn)品牌笑傲消費新高峰
- 五險一金包了,京東外賣全職騎手招募火爆進行中
- 小鵬G6車型升級來襲:81項體驗升級,3月上旬上市,你準備好了嗎?
- 保時捷中國召回190輛911系列汽車:安全帶隱患引關注
- 射雕手游2.0新版預告:武俠世界,英雄重生,3月13日與你不見不散!
- GPT-4.5天價面世:比DeepSeek貴千倍,網(wǎng)友直呼錢包受傷
- 全國公共充電樁規(guī)模破紀錄,廣東、浙江、江蘇三省占比超三分之一,綠色出行成新趨勢
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。