123,123,123

1024是2的十次方，也是二進(jìn)制計(jì)數(shù)的基本計(jì)量單位之一，每年的10月24日因此成為了中國程序員的盛會(huì)。近期，CSDN(中國開發(fā)者網(wǎng)絡(luò))第三屆“1024程序員節(jié)”(簡稱“大會(huì)”)順利舉辦，來自Linaro等開源組織的領(lǐng)導(dǎo)者和微軟、騰訊、華為、合合信息等企業(yè)的技術(shù)專家接連登陸主論壇重磅活動(dòng)《全體大會(huì)：2022技術(shù)英雄會(huì)》，與觀眾云端話科技。

生產(chǎn)生活中，被整齊記錄在二維表結(jié)構(gòu)里的“結(jié)構(gòu)化”數(shù)據(jù)只是少數(shù)。據(jù)國際數(shù)據(jù)公司(IDC)預(yù)測，全球非結(jié)構(gòu)化數(shù)據(jù)將在2025年占據(jù)數(shù)據(jù)總量的80%至90%。智能文檔處理技術(shù)能夠?qū)Ω鞣N文件、圖片中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行內(nèi)容識(shí)別和抽取，對推進(jìn)企業(yè)數(shù)字化轉(zhuǎn)型意義重大。

怎樣從數(shù)據(jù)中發(fā)現(xiàn)更多的價(jià)值，找到更實(shí)用的開發(fā)工具，是程序員群體重點(diǎn)關(guān)注的話題。合合信息智能創(chuàng)新事業(yè)部總經(jīng)理唐琪受邀分享智能文檔處理的技術(shù)優(yōu)化方法及開源渠道介紹，獲得了眾多開發(fā)者的認(rèn)可。

“智能文檔處理”在開發(fā)者群體中熱度攀升(圖源：CSDN官網(wǎng))

文檔處理之困：識(shí)別文字還不夠，版式理解是基礎(chǔ)

智能文檔處理技術(shù)本質(zhì)上是把文檔里的信息從載體中剝離出來，將其對接到其他系統(tǒng)，以數(shù)據(jù)的流轉(zhuǎn)實(shí)現(xiàn)流程自動(dòng)化的技術(shù)。典型場景如單據(jù)的自動(dòng)審核，就是先對單據(jù)進(jìn)行圖像檢測，從中提取所需信息并錄入到系統(tǒng)里，經(jīng)過結(jié)構(gòu)化處理，“翻譯”成機(jī)器能理解的內(nèi)容后再進(jìn)行自動(dòng)判別，達(dá)到節(jié)省人工成本、提高工作效率的目的。

唐琪在分享中指出，采集設(shè)備的不確定性和文檔版式的多樣性，導(dǎo)致文檔在處理過程中經(jīng)常遇到“看不清、看不準(zhǔn)、認(rèn)不全、難理解”四大類問題。合合信息在彎曲矯正、去摩爾紋(屏幕紋)等圖像質(zhì)量增強(qiáng)領(lǐng)域進(jìn)行了深入研究，為信息的提取、存儲(chǔ)、檢索、管理等后續(xù)工作創(chuàng)造良好的環(huán)境。

合合信息去摩爾紋(屏幕紋)技術(shù)處理效果

合合信息彎曲矯正技術(shù)處理效果

“在各種場景的實(shí)踐中我們發(fā)現(xiàn)，單純的文字識(shí)別不足以支撐更細(xì)致的文檔處理需求，版面元素分析才是基礎(chǔ)。”唐琪提到，文檔處理過程中要重點(diǎn)關(guān)注對印章、logo、水印、頁眉、二維碼、公式等元素的檢測，根據(jù)檢測結(jié)果采取對應(yīng)的版式分析方式，可得到更精準(zhǔn)的識(shí)別結(jié)果。

合合信息對智能文檔處理的關(guān)鍵要素的思考

如何讓已經(jīng)接受過市場檢驗(yàn)的技術(shù)產(chǎn)品惠及更多的開發(fā)者?技術(shù)服務(wù)的共享是促進(jìn)科技創(chuàng)新的重要渠道。合合信息將在制造業(yè)、金融業(yè)、物流業(yè)等30個(gè)行業(yè)應(yīng)用里打磨出的核心技術(shù)產(chǎn)品“智能文字識(shí)別服務(wù)平臺(tái)”(簡稱“平臺(tái)”)以SaaS的形式免費(fèi)開放給個(gè)人開發(fā)者，助力使用者們低成本、高效率獲取貼合個(gè)性化需求的定制模型。

合合信息開源平臺(tái)：10分鐘完成模型構(gòu)建，10張樣本即可做訓(xùn)練

受遠(yuǎn)程辦公趨勢發(fā)展和環(huán)保“無紙化”倡導(dǎo)的影響，社會(huì)對智能文檔處理技術(shù)的需求不斷增加。合合信息智能文檔處理技術(shù)可支持全球超過50種主流語言的印刷體、手寫體的高精度識(shí)別，以及增值稅發(fā)票、出租車票等20多種票據(jù)的識(shí)別，這些通用識(shí)別、信息抽取能力被搭載于合合信息智能文字識(shí)別服務(wù)平臺(tái)SaaS版中，并于大會(huì)上開放試用。

該平臺(tái)提供了海量訓(xùn)練數(shù)據(jù)快速生成、自動(dòng)化模型生成、完整的模型訓(xùn)練和測試等功能，具備低使用門檻、所需樣本少、開發(fā)周期短的優(yōu)勢，使用者通過云端的簡單操作，即可定制提取標(biāo)準(zhǔn)和非標(biāo)準(zhǔn)版式文檔的結(jié)構(gòu)化信息，僅需10張樣本就可以開始訓(xùn)練。

合合信息智能文字識(shí)別服務(wù)平臺(tái)工作流程

現(xiàn)階段，企業(yè)對于OCR的需求趨向于定制化和多樣化，卻為高昂的開發(fā)成本所限，平臺(tái)可為中小企業(yè)的數(shù)字化轉(zhuǎn)型提供助力。比起傳統(tǒng)的技術(shù)方案，企業(yè)更希望被賦予人工智能產(chǎn)品開發(fā)能力，去搭建基于自有業(yè)務(wù)場景的識(shí)別模型。在平臺(tái)上，企業(yè)可通過簡單的配置快速產(chǎn)出結(jié)構(gòu)化識(shí)別模型，無需服務(wù)器資源與運(yùn)維投入便可獲取技術(shù)支持，降低開發(fā)、部署與運(yùn)維環(huán)節(jié)中的門檻。

據(jù)悉，實(shí)測中應(yīng)用人員最短可在10分鐘內(nèi)完成抽取模型開發(fā)全流程，可視化界面設(shè)計(jì)讓沒有算法基礎(chǔ)的業(yè)務(wù)人員也可順利使用。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實(shí)，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

10分鐘完成模型開發(fā)！合合信息智能文字識(shí)別服務(wù)平臺(tái)亮相1024程序員節(jié)

10分鐘完成模型開發(fā)！合合信息智能文字識(shí)別服務(wù)平臺(tái)亮相1024程序員節(jié)