由百度聯(lián)合馬來亞大學(xué)、華南理工大學(xué)、西班牙巴塞羅那自治大學(xué)-計算機視覺中心、中國圖象圖形學(xué)會主辦的ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標注大規(guī)模街景文字)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字)國際權(quán)威競賽任務(wù)于5月圓滿結(jié)束。此次競賽共吸引來自業(yè)界頂尖技術(shù)團隊、高校及科研機構(gòu)共118支團隊參賽,有效提交結(jié)果總計339個。經(jīng)過兩個月的激烈角逐,ICDAR 2019-ArT競賽五項子任務(wù)的冠軍分別由中科院(文字檢測)、曠視(Latin文字識別)、韓國NAVER(Latin中文混合文字識別)、北京航空航天大學(xué)(Latin文字、Latin中文混合端到端文字識別)獲得,ICDAR 2019-LSVT競賽文字檢測和端到端文字識別兩項任務(wù)冠軍由騰訊團隊獲得。
精英薈聚ICDAR2019 桂冠引群雄爭奪
ICDAR“Robust Reading Competitions”競賽是評估自然場景/網(wǎng)絡(luò)圖片/復(fù)雜視頻文本提取與智能識別新技術(shù)進展的權(quán)威國際賽事及評測標準,競賽中涌現(xiàn)出諸多方法持續(xù)推動業(yè)界新技術(shù)的創(chuàng)新與應(yīng)用。在ICDAR2019百度發(fā)布的兩項極具挑戰(zhàn)的競賽任務(wù)中, ICDAR 2019-LSVT競賽數(shù)據(jù)包括5萬張精標注街景圖像、40萬張弱標注街景圖像,聚焦探索大規(guī)模數(shù)據(jù)場景下深度學(xué)習(xí)文字識別能力極限。ICDAR2019-ArT競賽數(shù)據(jù)總計10176張,是業(yè)界最大的任意形狀場景文字集合,聚焦推動自然場景下任意形狀文字檢測識別能力新突破。
各工業(yè)界與學(xué)術(shù)界頂尖團隊充分發(fā)揮各自技術(shù)優(yōu)勢,針對競賽任務(wù)不斷優(yōu)化創(chuàng)新方案與算法效果,經(jīng)過激烈角逐的比賽結(jié)果展現(xiàn)出大規(guī)模街景文字識別深度學(xué)習(xí)、任意形狀文字檢測與識別技術(shù)新高度。百度聯(lián)合學(xué)術(shù)界將持續(xù)對該競賽集合及榜單進行維護,為推進相關(guān)視覺AI技術(shù)領(lǐng)域不斷發(fā)展貢獻力量。
圖1. ICDAR 2019-LSVT競賽結(jié)果示例:人工標注 vs 算法效果
圖2. ICDAR 2019-ArT競賽結(jié)果示例:人工標注 vs 算法效果
百度OCR實力強勁 多場景應(yīng)用實踐豐富
此次ICDAR 2019國際競賽任務(wù)推動了大規(guī)模街景深度學(xué)習(xí)文字識別及任意形狀文字識別方向的發(fā)展,是一場學(xué)術(shù)交流與技術(shù)碰撞的盛宴。而在ICDAR 2019國際競賽中,百度OCR承擔(dān)競賽組織者角色,這也進一步加強了百度的國際影響力。
百度曾在2015至2019年期間多次獲得ICDAR 2013、 ICDAR 2015、ICDAR 2017-MLT、ICDAR2017-RCTW權(quán)威集合檢測、識別、端到端各項任務(wù)榜單第一,處于業(yè)內(nèi)領(lǐng)先水平。近兩年來,百度OCR也多次在CVPR,ICCV,BMVC,ACCV,ICDAR等會議上發(fā)表論文,此次ICDAR 2019有兩篇新工作被接收。"An End-to-end Video Text Detector with Online Tracking" 致力于解決視頻OCR檢測問題,將視頻文字檢測和在線跟蹤任務(wù)高效集成到統(tǒng)一、可訓(xùn)練的網(wǎng)絡(luò)框架中。"EATEN: Entity-aware Attention for Single Shot Visual Text Extraction"提出端到端的結(jié)構(gòu)化信息提取方法,同時公開了結(jié)構(gòu)化信息提取領(lǐng)域的大型數(shù)據(jù)集合。
百度不僅致力于OCR技術(shù)領(lǐng)域的縱深研究,同時也是“領(lǐng)先且實用AI視覺技術(shù)”的堅定實踐者。多年實踐經(jīng)驗積累形成了豐富的百度OCR產(chǎn)品矩陣。通用系列文字識別能力不僅能高精度的識別文字,還支持中、英、日、韓、法等十國語言的識別以及置信度、位置等信息的返回;卡證識別能力不僅支持對身份證、銀行卡、護照、名片等常見卡證的識別,還支持卡證采集、分類、屬性判斷等能力;票據(jù)識別能力不僅支持財務(wù)場景全品類識別,還支持金融、醫(yī)療等場景票據(jù)識別;針對終端文字識別場景,百度領(lǐng)先的模型壓縮技術(shù)應(yīng)用于所有OCR終端產(chǎn)品,OCR終端SDK與多家手機廠商達成合作,將識字能力賦予手機。目前,百度OCR產(chǎn)品能力已超50項,在各行業(yè)實現(xiàn)了諸多技術(shù)突破與產(chǎn)品落地,覆蓋了財務(wù)、銀行、醫(yī)療、政法、教育、交通、電商、快遞等場景。
未來,百度會與各企業(yè)持續(xù)探索OCR的落地可能性,讓OCR賦能更多企業(yè),同時也將持續(xù)秉持普惠的價值理念,在產(chǎn)業(yè)實踐中不斷打磨,持續(xù)賦能服務(wù)客戶,持續(xù)打造領(lǐng)先且實用的AI技術(shù),用科技的力量讓復(fù)雜的世界更簡單。
- 馬蜂窩新思路:AI技術(shù)引領(lǐng)旅行社翻開流量新篇章
- 同程旅行創(chuàng)新升級:首家接入DeepSeek的程心大模型,探索智能旅行新篇章
- 曹操出行智行自動駕駛平臺蘇杭試運營:Robotaxi探索未來出行新篇章
- 2月3C數(shù)碼市場爆款頻出:國補推動下,國產(chǎn)品牌笑傲消費新高峰
- 五險一金包了,京東外賣全職騎手招募火爆進行中
- 小鵬G6車型升級來襲:81項體驗升級,3月上旬上市,你準備好了嗎?
- 保時捷中國召回190輛911系列汽車:安全帶隱患引關(guān)注
- 射雕手游2.0新版預(yù)告:武俠世界,英雄重生,3月13日與你不見不散!
- GPT-4.5天價面世:比DeepSeek貴千倍,網(wǎng)友直呼錢包受傷
- 全國公共充電樁規(guī)模破紀錄,廣東、浙江、江蘇三省占比超三分之一,綠色出行成新趨勢
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。