作者:才能我浪費(fèi)99
1. 功能介紹
百度已經(jīng)推出了iOCR財(cái)會(huì)票據(jù)識(shí)別,針對(duì)財(cái)會(huì)報(bào)銷(xiāo)場(chǎng)景提出的專(zhuān)項(xiàng)解決方案,可對(duì)各類(lèi)財(cái)務(wù)票據(jù)、報(bào)銷(xiāo)單、銀行回單、對(duì)賬單進(jìn)行自動(dòng)分類(lèi)及結(jié)構(gòu)化識(shí)別,并支持用戶(hù)為固定版式的新票據(jù)/單據(jù)自定義結(jié)構(gòu)化識(shí)別模板及分類(lèi)器。百度iOCR財(cái)會(huì)票據(jù)識(shí)別功能非常的強(qiáng)大,我在:
這篇文章里面已經(jīng)進(jìn)行了比較詳細(xì)的介紹,大家有興趣可以看一下。
iOCR財(cái)會(huì)票據(jù)識(shí)別內(nèi)置了7種票據(jù)格式,如果我們要對(duì)其他的票據(jù)識(shí)別,比如機(jī)票行程單,要怎么辦呢? 這就是我們今天要介紹的自定義模板功能:百度iOCR自定義模板文字識(shí)別,針對(duì)未預(yù)置且版式固定的票據(jù)單據(jù),用戶(hù)只需上傳一張模板圖片,即可自助制作模板,建立圖片中文字的Key-Value對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)對(duì)相同版式圖片的結(jié)構(gòu)化識(shí)別。
我們?cè)诮裉斓倪@篇文章里會(huì)帶大家自定義一個(gè)機(jī)票行程單模板,包括相關(guān)的調(diào)用步驟、代碼及使用方案。
2.模板定義及平臺(tái)接入
進(jìn)入界面后,如果以前沒(méi)有定義過(guò)模板會(huì)提示大家建立模板,界面如圖:
大家按照提示進(jìn)行操作,首先上傳模板圖片,這里選擇一張機(jī)票行程單上傳。
然后是定義參考字段,注意參考字段不是識(shí)別的內(nèi)容,而是程序用來(lái)定位及判斷是否為模板,還是別的內(nèi)容的依據(jù)。
然后是選擇識(shí)別的內(nèi)容,這個(gè)是要識(shí)別的數(shù)據(jù)。本例子中選擇了姓名,總金額和機(jī)票號(hào)碼,3個(gè)字段。
選擇后可以點(diǎn)擊“試一試”看一下模板的效果
如果滿(mǎn)意,可以點(diǎn)擊發(fā)布,將模板發(fā)布出去。要記錄提示信息里面的模板ID,這個(gè)在下一步調(diào)用的時(shí)候要使用。
3.自定義模板調(diào)用攻略(Python3)及評(píng)測(cè)
3.1首先認(rèn)證授權(quán):
在開(kāi)始調(diào)用任何API之前需要先進(jìn)行認(rèn)證授權(quán),具體的說(shuō)明請(qǐng)參考:
具體Python3代碼如下:
3.2財(cái)會(huì)票據(jù)識(shí)別分析接口調(diào)用:
請(qǐng)求參數(shù):
大家注意templateSign就是我們?cè)谔峤欢x模板的時(shí)候返回的ID。
返回參數(shù):
Python3調(diào)用代碼如下:
4.功能評(píng)測(cè):
選一張機(jī)票對(duì)效果進(jìn)行測(cè)試,具體效果如下(以下例子均來(lái)自網(wǎng)上):
處理時(shí)長(zhǎng):5.03秒
返回JSON為
{'data': {'ret': [{'probability': {'average': 0.952863, 'min': 0.495304, 'variance': 0.01743}, 'location': {'height': 13, 'left': 88, 'top': 332, 'width': 127}, 'word_name': 'Number', 'word': '8472412222853'}, {'probability': {'average': 0.903623, 'min': 0.725142, 'variance': 0.012429}, 'location': {'height': 13, 'left': 821, 'top': 303, 'width': 87}, 'word_name': 'Total', 'word': 'cNY320.0'}, {'probability': {'average': 0.991988, 'min': 0.976156, 'variance': 0.000125}, 'location': {'height': 16, 'left': 26, 'top': 112, 'width': 45}, 'word_name': 'Name', 'word': '劉凱敏'}], 'templateSign': '6def20f811df8072292e39aa2ea382cb', 'templateName': 'airticket', 'scores': 1.0, 'isStructured': True, 'logId': '156862155738090', 'clockwiseAngle': 0.0}, 'error_code': 0, 'error_msg': ''}
提取內(nèi)容為:
Name:劉凱敏
Total: cNY320.0
Number: 8472412222853
測(cè)試下來(lái),整體識(shí)別效果不錯(cuò)。
5.測(cè)試結(jié)論和建議
經(jīng)過(guò)測(cè)試發(fā)現(xiàn),整體識(shí)別效果很好。對(duì)于自定義票據(jù)有很強(qiáng)的識(shí)別能力。該功能大大的擴(kuò)展了iOCR的識(shí)別范圍,對(duì)業(yè)務(wù)中的各種票據(jù)都可以進(jìn)行識(shí)別。對(duì)各類(lèi)發(fā)票、收據(jù)、銀行對(duì)賬單、承兌匯票等常用財(cái)務(wù)票據(jù)進(jìn)行模板制作,實(shí)現(xiàn)自動(dòng)分類(lèi)和結(jié)構(gòu)化識(shí)別及財(cái)稅場(chǎng)景的自動(dòng)化,可以有效降低企業(yè)人力成本,控制業(yè)務(wù)風(fēng)險(xiǎn)。
還有一個(gè)建議就是希望能在錄入模板的時(shí)候,提供智能選擇功能,一鍵把所有識(shí)別出來(lái)的內(nèi)容都選出來(lái),然后讓用戶(hù)在這個(gè)基礎(chǔ)上進(jìn)行調(diào)整,加快模板的開(kāi)發(fā)速度。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 新能源車(chē)技術(shù)升級(jí)搶先看,ChatGPT崩了引熱議:未來(lái)科技如何破局?
- 自動(dòng)駕駛行業(yè)大洗牌即將結(jié)束,小馬智行引領(lǐng)千臺(tái)車(chē)隊(duì)新篇章
- 微軟反壟斷風(fēng)暴:Office捆綁銷(xiāo)售引質(zhì)疑,云服務(wù)策略遭調(diào)查,巨頭陷困境
- 顯卡漲價(jià)風(fēng)暴來(lái)襲!NVIDIA/AMD緊急應(yīng)對(duì),全力加速生產(chǎn)運(yùn)回本土
- 微軟新目標(biāo):用1000億美元打造實(shí)用通用AI,未來(lái)可期但需謹(jǐn)慎
- 亞馬遜云科技陳曉建預(yù)測(cè):未來(lái)三年內(nèi),生成式AI將引發(fā)云市場(chǎng)新革命
- 林肯中國(guó)辟謠:財(cái)務(wù)調(diào)整非合并,業(yè)務(wù)不變穩(wěn)如泰山
- 字節(jié)跳動(dòng)研發(fā)大手筆:2024年投入接近BAT之和,能否引領(lǐng)中國(guó)OpenAI新潮流?
- 跨境匯款平臺(tái)新舉措:螞蟻集團(tuán)開(kāi)發(fā)者服務(wù)限每日10萬(wàn)美元,助力全球交易更便捷
- 我國(guó)充電樁建設(shè)提速,50%增長(zhǎng)背后的高速服務(wù)區(qū)充電新篇章
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。