7月7日—10日,以“智聯(lián)世界 眾智成城”為主題的2021世界人工智能大會在上海舉行。中國領先的人工智能及大數(shù)據科技企業(yè)合合信息在本次大會上展示了能“讀懂”甲骨文的智能文字識別技術,并重磅發(fā)布“數(shù)字政務大腦”平臺,吸引了來自全球五大洲的觀眾、商界領袖及科技界大咖駐足參觀體驗,成為全場最受關注的 “黑科技”產品。
能“讀懂”甲骨文的智能文字識別技術
合合信息的智能文字識別技術主要包含了智能圖像處理,基于深度學習的復雜場景文字識別,自然語言處理三個核心技術層。智能圖像處理技術主要對用戶拍攝的復雜文檔圖像進行預處理,使得文檔圖像質量得到大幅度提升?;谏疃葘W習的復雜場景文字識別技術,主要利用合合信息自研的手寫印刷混排識別,抗強干擾識別,扭曲文字識別,復雜印章和手寫識別等一系列先進深度學習識別技術來解決各種不同復雜場景下的文字識別問題。而自然語言處理技術,則是對識別出的結果進行進一步的語義理解。
此次在世界人工智能大會上展示智能文字識別技術,能對3600年前中華文明的古老文字——甲骨文進行識別。將形象豐富的甲骨文復刻在龜甲上再進行重新排列組合后,“單身狗”“白富美”“買它買它”等網絡熱詞被一一識別出來,令人忍俊不禁。
出土于商代的甲骨文是中國發(fā)現(xiàn)最早的文字,其圖案種類十分豐富,寓意表達明晰,同時又透露著東方文化的神秘。可是由于所處年代過于久遠,漫長的歷史塵跡,為甲骨文披上了一層朦朧的面紗。現(xiàn)在的甲骨文多在出版物上以圖片形式出現(xiàn),給文字檢索帶來困難,如今的年輕人對甲骨文的意義更是知之甚少。
合合信息相關技術負責人表示,“甲骨文識別的難點在于甲骨殘缺嚴重、素材難獲取、拓片清晰度低等難點,這些都是需要通過技術來解決。例如樣本素材少,從技術層面上,我們需要解決少樣本訓練的問題。目前我們主要是初步研究,更多的工作還在路上。”
目前合合信息的智能文字識別技術支持中、英、俄等56種語言的文檔圖像、100+種證件的快讀智能分類,以及全球不同國家、不同行業(yè)的卡證、票據、定制識別等多個AI場景的產品和解決方案。
發(fā)布“數(shù)字政務大腦”,助推城市治理數(shù)字化
除了智能文字識別技術以外,合合信息在此次世界人工智能大會上還發(fā)布了“數(shù)字政務大腦”平臺。該平臺基于合合信息商業(yè)大數(shù)據平臺,對全量企業(yè)、全產業(yè)鏈和區(qū)域經濟進行多維度政企數(shù)據融合、分析、挖掘。
“數(shù)字政務大腦”由四個主要部分構成:區(qū)域經濟數(shù)字監(jiān)測大腦、產業(yè)鏈數(shù)字招商大腦、轄區(qū)企業(yè)數(shù)字監(jiān)管服務大腦、精準政策數(shù)字服務大腦。這背后離不開合合信息的大數(shù)據庫,其有超過2.3億企業(yè)及組織機構實時數(shù)據、1000億條企業(yè)全景信息、1000多個數(shù)據維度向外輸出數(shù)字化風控方案。
區(qū)別于普通政務平臺簡單的數(shù)字羅列,“數(shù)字政務大腦”可以將城市產業(yè)數(shù)據進行匯聚、融合、建模,打破城市數(shù)據孤島,拓寬招商通道,優(yōu)選招商企業(yè)。通過對重點產業(yè)發(fā)展分析與研判,發(fā)現(xiàn)本地優(yōu)勢企業(yè),尋找區(qū)域產業(yè)發(fā)力點。
如何把智能文字識別技術和大數(shù)據服務更好地應用于數(shù)字社會的美好生活場景,是合合信息一直努力的方向。在AI帶動數(shù)字化、智能化的今天,合合信息將發(fā)揮大數(shù)據和智能識別技術所長,為智能政務搭建數(shù)字化轉型“底座”;為各行業(yè)提供更多場景化、數(shù)智化的大數(shù)據解決方案和智能識別服務。讓AI引領人類進步,讓大數(shù)據推動經濟、社會和人類的發(fā)展,合合信息將推動行業(yè)技術創(chuàng)新,探索科技行業(yè)的廣深空間。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。