【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

一、需求描述:

信息智能化時代,大部分中小企業(yè)都用上了ERP等辦公軟件,數字化紙質內容,軟件化管理數據,做到無紙化辦公。但仔細觀察,中小企業(yè)還是有一些工作流程可以進行改進的。

例如,公司進行人員應聘時,都是先打印應聘表格,然后讓應聘人員填寫內容,最后由文員將應聘表格的內容輸入到ERP系統(tǒng)內。其中,文員將應聘內容輸入到ERP系統(tǒng)內,這個步驟是相當耗時費力的,如果當天應聘人員比較多,那將花費文員大量的時間去輸入應聘信息。

如果能夠利用百度的手寫文字識別功能,結合【IOCR自定義模板文字識別】,智能識別應聘表格內容,并將識別結果填入對應的軟件、或是生成相應的EXCEL等電子文檔,那么文員只需要校對一下識別的內容是否正確,就能一鍵保存/導入,很快的做好應聘信息錄入工作,大量減輕文員的錄入工作。

以此類推,像請假條、辦公采購單,員工日工資明細等一些表格都可以通過百度手寫文字識別的方法來進行智能識別,極大降低文員的工作量,提高文員的工作效率。

此外,在個人應用方面,可以將個人的會議紀要,演講稿等使用【手寫文字識別】功能,數字化內容存儲起來,可以結合【百度網盤】實現(xiàn)永久保存。像文字工作者,有些習慣用筆記錄的、不習慣用電腦打字的,到時候都可以采用【手寫文字識別】功能,將文字數據化,稍微整理再上傳到相應的平臺上去。

另外,在學校應用方面,教師批改學生作文,是一件耗時耗力的事情,學生的筆跡各不相同,有時候單單識別學生文字內容就很耗心力,這樣的話,教師往往花費了很大的精力在識別學生文字上去。如果采用【手寫文字識別】功能,將作文數字化,統(tǒng)一成標準文字,再用采取一些【護眼模式】等方法顯示,就大大方便教師閱讀修改,減輕教師的閱讀作文所消耗精力,更加專注于作文思想內容、發(fā)現(xiàn)好文章,如果可行,甚至可以嘗試將這個方法運用到全國的高考作文改卷中去。

二、應用價值:

1、利用百度【手寫文字識別】功能,結合【IOCR自定義模板文字識別】,AI前后文判斷智能糾錯等功能,可大大降低文員文字錄入工作量,提高文員工作效率,適合大部分中小企業(yè)。

2、如果能將【手寫文字識別】功能離線化,或者可以單獨部署到企業(yè)自己的服務器上去,那將具有更大的應用前景。

3、利于百度【手寫文字識別】功能,數字化個人/專業(yè)文字工作者的演講稿、筆記等,并結合【百度網盤】等實現(xiàn)永久保存。

4、可以嘗試將【手寫文字識別】運用到學生的作文批改中去,讓教師更加專注于作文的思想內容、發(fā)現(xiàn)好文章,甚至推廣到全國的高考作文改卷中去,這樣不僅減輕了教師的作文批改工作壓力,同時也能發(fā)現(xiàn)更多有思想、有內涵的好文章。

三、使用攻略

說明:本文采用C# 語言,開發(fā)環(huán)境為.Net Core 2.1。

1、平臺接入

具體接入方式比較簡單,可以參考度友愛小妞寶的帖子,可參考到【創(chuàng)建應用程序】這一步驟(主要獲取APPID等信息,調用時會用的),后面的使用由于我是采用.Net Core 平臺的C#、SDK方案,故有些不同

2、接口調用說明

文字識別接入官方說明文檔(C#,SDK方案):

(1)接口描述

對手寫中文漢字、數字進行識別。

(2)安裝文字識別 C# SDK

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

四、示例關鍵代碼

1、前臺.cshtml 頁面布局關鍵代碼

由于html代碼無法原生顯示,只能簡單說明一下:

主要是一個form表單,需要設置屬性enctype="multipart/form-data",否則無法上傳圖片;

form表單里面有兩個控件:

一個Input,type="file",上傳圖片用;

一個Input,type="submit",提交并返回識別結果。

2、后臺.cshtml.cs調用關鍵代碼

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

五、效果測試

1、頁面:

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

2、識別結果:

(1)

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

(2)

【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效

說明:因為攻略主要介紹如何使用手寫文字識別功能,所以對文字處理這塊不進行深入操作。如果想進一步提高識別結果,可以采取將識別結果輸出為字符串,然后使用正則表達式提取相應的文字內容,或者進一步導出為EXCEL文件等。

六、改進建議

1、存在的問題:

(1)部分內容,正常情況下,應該將其識別為兩條記錄的,結果最后變成了一條記錄,特別是【文字-數字-文字-數字】這樣的行信息組合的時候,如果文字、數字的距離較近,很容易將數字和文字識別在一起了,需要改進。

(2)再如像“娘”這樣偏旁部首是單獨的字組成的字時,會識識別成“女良”兩個字,這點也需要改進。

(3)目前對稍微潦草的字跡識別率還不是很高,需要改進。

由于計算機、手機等電子設備的普及,大部分人都習慣了打字,手寫情況大大減少,由此導致很大一部分人寫的字龍飛鳳舞,比較難以識別(我寫的字就很潦草,有時候連自己都無法認出來。。。)經過測試,百度手寫文字識別能力雖然比較優(yōu)秀了,但是離真正應用到實際工作中去還是有一定的距離的。

2、改進建議

(1)結合【IOCR自定義模板文字識別】功能,智能識別模板內容,格式化提取內容,方便開發(fā)人員調用(目前好像已支持手寫數字識別,希望能更快增加支持手寫文字識別)。

(2)如果能格式化輸出內容,或一鍵導出EXCEL電子文檔等功能,則更加方便跟EPR等軟件的對接。

(3)可以運用AI技術,結合前后文智能識別錯別字,修正錯誤或語句問題,提高識別結果。

(4)若能將【手寫文字識別】功能離線話,或可以部署到企業(yè)自己的服務器上去,會有更多的企業(yè)愿意嘗試,也能將【手寫文字識別】功能運用到【財務報表】等保密性要求較強的方向中去。

(5)將【手寫文字識別】和【百度網盤】、【護眼模式】等工具結合起來,實現(xiàn)個人/專業(yè)文字工作者的筆記、演講稿、作文等內容的數字化存儲,方便觀看閱讀。

作者:讓天涯

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2019-12-11
【全代碼攻略】用百度大腦手寫文字識別助力企業(yè)降本增效
一、需求描述:信息智能化時代,大部分中小企業(yè)都用上了ERP等辦公軟件,數字化紙質內容,軟件化管理數據,做到無紙化辦公。

長按掃碼 閱讀全文