近日,在全球權威的ICDAR Robust Reading大賽榜單中,紫光華智憑借領先的AI技術優(yōu)勢,在文本行檢測與識別兩項任務中均斬獲第一,并一舉刷新榜單記錄,超越了榜單內其他知名AI公司和國內外學術研究機構,展現(xiàn)了紫光華智在自然場景文本檢測與識別領域的創(chuàng)新突破能力。
▲ 紫光華智位居文本行檢測榜單No.1
▲ 紫光華智位居文本行識別榜單No.1
ICDAR-ReCTS:全球OCR領域權威大賽
自然圖像中的文本帶有許多重要的語義信息,對文本的自動檢測和識別也受到越來越多的關注。在街景招牌中,為了美觀或突出某些元素,招牌中的漢字排列方式和字體與其他場景存在明顯差異,排列方向不同、布局分布不規(guī)則、字體類型多樣等難題極大制約了文本檢測與識別的準確率。
ICDAR-ReCTS(International Conference on Document Analysis and Recognition)是首次提出大規(guī)模自然場景中英文招牌數(shù)據(jù)集的比賽,也是全球OCR領域最具挑戰(zhàn)性、權威性的比賽之一,涵蓋了各種復雜場景,吸引著眾多國內外知名AI企業(yè)、學術研究機構參與。
紫光華智:以創(chuàng)新突破AI技術邊界
為提升自然場景文本檢測與識別能力,紫光華智基于深度學習算法,充分運用多層特征融合、跨層連接等技術,將不同級別特征結合,并運用文本注意力塊來捕捉像素的長范圍相關性以獲得更可靠分割結果;同時,結合多尺度融合、注意力機制、多模型融合等先進技術及基礎數(shù)據(jù)分析,對難例樣本進行數(shù)據(jù)增強,實現(xiàn)了對圖片像素低、質量差、藝術字體等識別效果的大幅提升。顯著提高了自然場景文本檢測與識別準確度,并成功躍居檢測與識別兩項榜單榜首。
▲ 各類復雜場景的文本檢測與識別
技術與應用融合,使AI服務于實戰(zhàn)
作為領先的AI視覺產(chǎn)品和解決方案提供商,紫光華智不僅注重核心技術的研發(fā)與投入,更注重技術與實際場景的融合應用,構筑二者間的相互進化機制,使技術真正服務于實戰(zhàn),通過實戰(zhàn)反哺技術進化。
面對不同業(yè)務場景的實際需求,紫光華智將領先的文本檢測與識別技術充分應用。
在道路交通場景,非機動車管理費神費力,不同地區(qū)非機動車牌格式和文本字符差異巨大,紫光華智車牌識別算法可自動讀取車牌信息,實現(xiàn)非機動車的智能化管理,同時有效遏制了非機動車偷盜事件的發(fā)生。針對機動車管理,紫光華智車牌識別算法為監(jiān)管部門在交通違法識別、高速違停等違法事件管理提供了有效幫助。
▲非機動車牌智能識別
▲ 機動車牌智能識別
在教育、金融等場景,不同證件票據(jù)格式不一,字符類型多樣,字段長短不一,識別難度巨大。紫光華智文本識別算法可精確讀取證件票據(jù)的文本信息,避免了人工手動錄入產(chǎn)生的錯誤,同時大幅提升了輸入工作效率,提高了工作智能化水平。
▲ 教育行業(yè)文本識別應用
在城市街道中,沿街商鋪為了吸引客戶存在設置多個招牌、招牌顏色各異、招牌大小不一、隨意變更招牌等問題,不僅影響市容市貌也存在安全隱患。紫光華智街面OCR識別算法可準確識別不同招牌的文本和語義信息,提升城市智能化管理能力和效率,助力城市精細化管理。
▲街面招牌識別
除此之外,紫光華智也在積極布局企業(yè)、醫(yī)療、能源等更多行業(yè)場景,充分發(fā)揮AI核心技術優(yōu)勢,不斷拓寬和挖掘AI技術應用的廣度與深度,推進技術成果向實戰(zhàn)價值的有效轉化,覆蓋更多行業(yè)需求,助力百行百業(yè)實現(xiàn)數(shù)字化轉型。
(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )