使用百度大腦iOCR,快速自定義機票行程單模板識別

作者:才能我浪費99

1. 功能介紹

百度已經(jīng)推出了iOCR財會票據(jù)識別,針對財會報銷場景提出的專項解決方案,可對各類財務(wù)票據(jù)、報銷單、銀行回單、對賬單進行自動分類及結(jié)構(gòu)化識別,并支持用戶為固定版式的新票據(jù)/單據(jù)自定義結(jié)構(gòu)化識別模板及分類器。百度iOCR財會票據(jù)識別功能非常的強大,我在:

這篇文章里面已經(jīng)進行了比較詳細的介紹,大家有興趣可以看一下。

iOCR財會票據(jù)識別內(nèi)置了7種票據(jù)格式,如果我們要對其他的票據(jù)識別,比如機票行程單,要怎么辦呢? 這就是我們今天要介紹的自定義模板功能:百度iOCR自定義模板文字識別,針對未預(yù)置且版式固定的票據(jù)單據(jù),用戶只需上傳一張模板圖片,即可自助制作模板,建立圖片中文字的Key-Value對應(yīng)關(guān)系,實現(xiàn)對相同版式圖片的結(jié)構(gòu)化識別。

我們在今天的這篇文章里會帶大家自定義一個機票行程單模板,包括相關(guān)的調(diào)用步驟、代碼及使用方案。

2.模板定義及平臺接入

進入界面后,如果以前沒有定義過模板會提示大家建立模板,界面如圖:

使用百度大腦iOCR,快速自定義機票行程單模板識別

大家按照提示進行操作,首先上傳模板圖片,這里選擇一張機票行程單上傳。

使用百度大腦iOCR,快速自定義機票行程單模板識別

使用百度大腦iOCR,快速自定義機票行程單模板識別

然后是定義參考字段,注意參考字段不是識別的內(nèi)容,而是程序用來定位及判斷是否為模板,還是別的內(nèi)容的依據(jù)。

使用百度大腦iOCR,快速自定義機票行程單模板識別

然后是選擇識別的內(nèi)容,這個是要識別的數(shù)據(jù)。本例子中選擇了姓名,總金額和機票號碼,3個字段。

使用百度大腦iOCR,快速自定義機票行程單模板識別

選擇后可以點擊“試一試”看一下模板的效果

使用百度大腦iOCR,快速自定義機票行程單模板識別

如果滿意,可以點擊發(fā)布,將模板發(fā)布出去。要記錄提示信息里面的模板ID,這個在下一步調(diào)用的時候要使用。

使用百度大腦iOCR,快速自定義機票行程單模板識別

3.自定義模板調(diào)用攻略(Python3)及評測

3.1首先認證授權(quán):

在開始調(diào)用任何API之前需要先進行認證授權(quán),具體的說明請參考:

具體Python3代碼如下:

使用百度大腦iOCR,快速自定義機票行程單模板識別

3.2財會票據(jù)識別分析接口調(diào)用:

使用百度大腦iOCR,快速自定義機票行程單模板識別

請求參數(shù):

使用百度大腦iOCR,快速自定義機票行程單模板識別

大家注意templateSign就是我們在提交定義模板的時候返回的ID。

返回參數(shù):

使用百度大腦iOCR,快速自定義機票行程單模板識別

Python3調(diào)用代碼如下:

使用百度大腦iOCR,快速自定義機票行程單模板識別

使用百度大腦iOCR,快速自定義機票行程單模板識別

4.功能評測:

選一張機票對效果進行測試,具體效果如下(以下例子均來自網(wǎng)上):

使用百度大腦iOCR,快速自定義機票行程單模板識別

處理時長:5.03秒

返回JSON為

{'data': {'ret': [{'probability': {'average': 0.952863, 'min': 0.495304, 'variance': 0.01743}, 'location': {'height': 13, 'left': 88, 'top': 332, 'width': 127}, 'word_name': 'Number', 'word': '8472412222853'}, {'probability': {'average': 0.903623, 'min': 0.725142, 'variance': 0.012429}, 'location': {'height': 13, 'left': 821, 'top': 303, 'width': 87}, 'word_name': 'Total', 'word': 'cNY320.0'}, {'probability': {'average': 0.991988, 'min': 0.976156, 'variance': 0.000125}, 'location': {'height': 16, 'left': 26, 'top': 112, 'width': 45}, 'word_name': 'Name', 'word': '劉凱敏'}], 'templateSign': '6def20f811df8072292e39aa2ea382cb', 'templateName': 'airticket', 'scores': 1.0, 'isStructured': True, 'logId': '156862155738090', 'clockwiseAngle': 0.0}, 'error_code': 0, 'error_msg': ''}

提取內(nèi)容為:

Name:劉凱敏

Total: cNY320.0

Number: 8472412222853

測試下來,整體識別效果不錯。

5.測試結(jié)論和建議

經(jīng)過測試發(fā)現(xiàn),整體識別效果很好。對于自定義票據(jù)有很強的識別能力。該功能大大的擴展了iOCR的識別范圍,對業(yè)務(wù)中的各種票據(jù)都可以進行識別。對各類發(fā)票、收據(jù)、銀行對賬單、承兌匯票等常用財務(wù)票據(jù)進行模板制作,實現(xiàn)自動分類和結(jié)構(gòu)化識別及財稅場景的自動化,可以有效降低企業(yè)人力成本,控制業(yè)務(wù)風險。

還有一個建議就是希望能在錄入模板的時候,提供智能選擇功能,一鍵把所有識別出來的內(nèi)容都選出來,然后讓用戶在這個基礎(chǔ)上進行調(diào)整,加快模板的開發(fā)速度。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-11-19
使用百度大腦iOCR,快速自定義機票行程單模板識別
作者:才能我浪費991. 功能介紹百度已經(jīng)推出了iOCR財會票據(jù)識別,針對財會報銷場景提出的專項解決方案,可對各類財務(wù)票據(jù)、報銷單、銀行回單、對賬單進行自動分類

長按掃碼 閱讀全文