123,123

近年來隨著深度學(xué)習(xí)的不斷前進(jìn)，包括場景文本檢測與識別技術(shù)在內(nèi)的光學(xué)字符識別(Optical Character Recognition，OCR)得到了飛速發(fā)展。然而，印章這一生活辦公中隨處可見的重要元素卻未獲得關(guān)注，印章抬頭識別這一重要課題也面臨各式各樣的印章形狀、彎曲的文本內(nèi)容、復(fù)雜的背景要素以及無處不在的重疊文本等諸多難題。今年舉辦的第17屆ICDAR國際學(xué)術(shù)競賽中，就設(shè)置了印章抬頭識別競賽板塊，為針對性解決印章抬頭文本檢測和端到端印章抬頭文本內(nèi)容識別痛點(diǎn)尋求方案。

ICDAR(International Conference on Document Analysis and Recognition)是全球文檔圖像分析識別領(lǐng)域公認(rèn)的權(quán)威學(xué)術(shù)會議，也是世界上舉辦最早和最成功的OCR賽事之一，更是評測和檢驗(yàn)自然場景/網(wǎng)絡(luò)圖片文本自動提取與智能識別最新技術(shù)研究進(jìn)展的重要國際賽事及標(biāo)準(zhǔn)。ICDAR系列賽事的高技術(shù)難度、高實(shí)際應(yīng)用性，備受眾多科研院校、科技公司的廣泛關(guān)注，賽事舉辦至今已有119個國家的7821多支隊伍參與其中，持續(xù)為OCR技術(shù)發(fā)展注入推動力量。

本次大賽的2023印章抬頭識別競賽板塊(ICDAR 2023 Reading the Seal Title)由多位領(lǐng)域?qū)＜医M織展開，實(shí)在智能作為AI領(lǐng)域的準(zhǔn)獨(dú)角獸企業(yè)，憑借在人工智能領(lǐng)域深耕多年的豐厚經(jīng)驗(yàn)和領(lǐng)先的技術(shù)方案，與浙江大學(xué)、中國科學(xué)院信息工程研究所、中國移動云中心等優(yōu)秀單位共同位列十強(qiáng)!

實(shí)在智能此次參賽的解決方案，是基于先前領(lǐng)域內(nèi)研究成果進(jìn)一步創(chuàng)新提出的“兩階段”的識別方法：第一階段檢測彎曲文本方案提出以五階的貝塞爾曲線擬合彎曲文本，實(shí)驗(yàn)證明這一改進(jìn)取得了更好的擬合效果;第二階段對抬頭文本的識別中設(shè)計了更強(qiáng)大的骨干網(wǎng)絡(luò)，增對各個印章類型設(shè)計了在線增強(qiáng)策略，合成了10萬張合成數(shù)據(jù)用于訓(xùn)練，最終在Task 2. End-to-end Seal Title Recognition 任務(wù)上排名挺進(jìn)前十。此次競賽中的優(yōu)秀成績，再一次彰顯了實(shí)在智能突出的全自研OCR能力。

目前，實(shí)在智能已結(jié)合產(chǎn)品落地經(jīng)驗(yàn)和收集的語料，繼續(xù)迭代優(yōu)化了OCR檢測和識別模型，實(shí)現(xiàn)了自有的通用文字識別、表格識別、鍵值抽取、通用證照、印章識別等功能，其AI產(chǎn)品IDP文檔審閱正是通過運(yùn)用光學(xué)字符識別(OCR)、自然語言處理能力(NLP)等前沿技術(shù)為核心的文本智能處理智能產(chǎn)品，應(yīng)用于信息電子化、風(fēng)險預(yù)警等業(yè)務(wù)領(lǐng)域，為賦能更多行業(yè)數(shù)字化升級轉(zhuǎn)型帶來場景解決方案。

在此基礎(chǔ)上，實(shí)在智能近期還融合人工智能領(lǐng)域前沿的大型語言模型(LLM)和OCR、NLP等核心技術(shù)，進(jìn)一步賦能IDP文檔審閱，推出了首款能夠自動讀懂文檔并與用戶交流對話的Chat-IDP。

Chat-IDP是借助行業(yè)領(lǐng)先AI能力，OCR、NLP、LLM等核心技術(shù)，實(shí)現(xiàn)AI處理文檔的一款智能產(chǎn)品，能夠自動分析內(nèi)容密集、篇幅長、非結(jié)構(gòu)化的文檔，從而實(shí)現(xiàn)內(nèi)容風(fēng)險審查、智能歸檔、關(guān)鍵信息抽取、比對，創(chuàng)新打造了智能文本審核的全新范式，進(jìn)一步優(yōu)化了AI能力邊界，提升用戶的交互使用體驗(yàn)，以更自動化、智能化的文檔審閱流程節(jié)省人工閱讀文檔以及檢索關(guān)鍵信息的精力以及時間成本，在確保95%以上準(zhǔn)確率的基礎(chǔ)上，幫助業(yè)務(wù)人員實(shí)現(xiàn)效率提升超5倍的智能文檔審核工作。

值得一提的是，實(shí)在智能在OCR、NLP、CV等關(guān)鍵技術(shù)方面均已取得重要突破，擁有位居行業(yè)第一的數(shù)百項獨(dú)立自主知識產(chǎn)權(quán)和數(shù)十項實(shí)際授予發(fā)明專利。今后，實(shí)在智能也將基于大型語言模型領(lǐng)域的開發(fā)能力與經(jīng)驗(yàn)，繼續(xù)堅持客戶第一的價值觀，在全面支持信創(chuàng)的實(shí)在RPA產(chǎn)品體系中整合進(jìn)大型語言模型技術(shù)，加速實(shí)現(xiàn)部分領(lǐng)域的“即說即所得”服務(wù)能力，以創(chuàng)新的交互方式與技術(shù)能力確保為千行百業(yè)的客戶打造契合多重場景需求的AI落地應(yīng)用，助其輕松上手各類數(shù)字化工具。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

文檔圖像識別領(lǐng)域頂級賽事“ICDAR2023”，實(shí)在智能展現(xiàn)AI雄厚實(shí)力！

文檔圖像識別領(lǐng)域頂級賽事“ICDAR2023”，實(shí)在智能展現(xiàn)AI雄厚實(shí)力！