日前,阿里媽媽圖像團(tuán)隊(duì)的OCR(圖中文字識別)技術(shù)刷新了ICDAR Robust Reading競賽數(shù)據(jù)集的全球最好成績,并大幅超越第二名。Robust Reading競賽是當(dāng)前OCR技術(shù)領(lǐng)域全球最具影響力的比賽。這也是繼阿里巴巴圖像搜索領(lǐng)軍人物華先勝獲得ACM(美國計(jì)算機(jī)協(xié)會)“杰出科學(xué)家”稱號之后,阿里的圖像識別技術(shù)再一次登上國際頂尖舞臺。
圖. ICDAR Robust Reading Challenge 1 end-to-end官方成績
借助這一領(lǐng)先的OCR技術(shù),阿里媽媽圖像團(tuán)隊(duì)能夠以95%的超高準(zhǔn)確率識別圖中違規(guī)文字信息,有效過濾商家惡意推廣,維護(hù)消費(fèi)者權(quán)益。2015年,阿里媽媽累計(jì)屏蔽了4600萬條惡意推廣。
OCR是計(jì)算機(jī)視覺領(lǐng)域的經(jīng)典問題,長久以來,一直受到學(xué)術(shù)界和工業(yè)界的持續(xù)關(guān)注。在工業(yè)界,Google、Microsoft、Amazon等大型互聯(lián)網(wǎng)公司,以及商湯科技、曠視科技(擁有Face++、Image++)等計(jì)算機(jī)視覺技術(shù)創(chuàng)業(yè)公司,都在OCR技術(shù)上耕耘多年。隨著技術(shù)不斷成熟,OCR也開始在互聯(lián)網(wǎng)及其他行業(yè)逐步上線使用。
據(jù)阿里媽媽定向算法技術(shù)負(fù)責(zé)人蓋坤介紹,在阿里巴巴平臺上營銷創(chuàng)意、商品等均是以圖片形式展示,圖像技術(shù)是理解這些信息的重要手段。同時,也有不良商家在圖片中內(nèi)嵌一些違規(guī)的信息達(dá)到其惡意推廣的目的,圖片內(nèi)文字違規(guī)是比例相當(dāng)大的一類,而傳統(tǒng)監(jiān)控手段多以人工肉眼來審核,費(fèi)時費(fèi)力,尤其是隨著圖片數(shù)量越來越大,這幾乎已成為不可完成的任務(wù)。針對這一強(qiáng)烈需求,從2014年開始,阿里媽媽圖像團(tuán)隊(duì)開始重點(diǎn)攻堅(jiān)O(shè)CR技術(shù),通過機(jī)器視覺的方式從圖片中識別出文字,從而鑒別出違規(guī)的文案信息。
對惡意推廣的定義,蓋坤表示,一方面依據(jù)國家相關(guān)法律法規(guī),對于違禁品、色情信息、封建迷信、假冒偽劣、減肥豐胸、夸大虛假等違規(guī)類型進(jìn)行不同程度的處罰和管理,另一方面在法規(guī)之外平臺有著更高要求,對損害消費(fèi)者利益或進(jìn)行不正當(dāng)競爭的推廣類型積極嘗試進(jìn)行管控。其中,與消費(fèi)者關(guān)系最為密切的假冒偽劣單項(xiàng)違規(guī)類型,被阿里媽媽作為重點(diǎn)審查對象。
相對其他限定場景OCR應(yīng)用相比,阿里媽媽要處理的創(chuàng)意圖片和商品圖片上的文字字體、色彩更加多樣,文字布局更加靈活,背景包括各種商品、布景或自然場景,蘊(yùn)含各種復(fù)雜紋理,給識別問題帶來了更大的挑戰(zhàn)。蓋坤介紹,在技術(shù)路線上,相比于傳統(tǒng)方法,拋棄了圖像預(yù)處理、字符分割等流程,采用了多個深度神經(jīng)網(wǎng)絡(luò)和語言模型相結(jié)合的方法來組成完整的OCR系統(tǒng)。針對復(fù)雜的場景信息,將LSTM(長短時記憶)技術(shù)成功應(yīng)用到建模中去,大大提高識別的準(zhǔn)確率。
據(jù)悉,現(xiàn)在基于OCR文字識別實(shí)時審核已覆蓋整個阿里媽媽業(yè)務(wù),每天處理圖片近千萬張,自動反饋疑似違規(guī)圖片準(zhǔn)確率達(dá)95%以上;同時將圖文審核風(fēng)險(xiǎn)發(fā)現(xiàn)時間從“天”降低到“秒”級。數(shù)據(jù)顯示,2015年阿里媽媽累計(jì)屏蔽了4600萬條惡意推廣,有效凈化了互聯(lián)網(wǎng)營銷環(huán)境。
除OCR過濾惡意推廣以外,計(jì)算機(jī)視覺技術(shù)在阿里巴巴集團(tuán)內(nèi)部已經(jīng)獲得廣泛使用,比如手淘的“拍立淘”產(chǎn)品,通過手機(jī)拍照即可搜索相似商品,2015年雙11當(dāng)天,千萬消費(fèi)者使用了“拍立淘”功能,創(chuàng)造了超過數(shù)千萬元的銷售額。另外,在商品圖片版權(quán)保護(hù)、鑒黃等場景也都引入了計(jì)算機(jī)視覺技術(shù)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- GitLab將告別中國區(qū)用戶:是時候選擇新的“極狐”或保護(hù)賬號了
- 蘋果明年推至少22款新品,阿里非洲首站啟動,科技新品盛宴拉開帷幕
- SUSE預(yù)測:未來私有AI平臺崛起,讓我們共同見證AI的未來
- AI伴侶“小奇”:奇富科技重塑金融服務(wù)體驗(yàn)的探索之作
- 揭秘軟銀孫正義神秘芯片計(jì)劃:打造超越NVIDIA的未來科技新星
- 大模型創(chuàng)企星辰資本獲數(shù)億融資,騰訊啟明等巨頭入局,人工智能新篇章開啟
- 大模型獨(dú)角獸階躍星辰融資新動態(tài):數(shù)億美金B(yǎng)輪,揭秘星辰未來之路
- 哪吒汽車創(chuàng)始人資金遭凍結(jié),1986萬元股權(quán)風(fēng)波引關(guān)注
- 本田與日產(chǎn)醞釀合并:明年6月敲定協(xié)議,新公司社長待本田推薦
- 金融大模型新突破:百川智能Baichuan4-Finance引領(lǐng)行業(yè),準(zhǔn)確率領(lǐng)先GPT-4近20%,變革金融業(yè)未來
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。