記者近日從工信部獲悉,中國將加大力度支持新一代語音識別框架、口語化語音識別、智能對話、音視頻融合、語音合成等技術的創(chuàng)新應用,并在智能制造、智能家居等重點領域開展推廣應用。到2020年實現多場景下中文語音識別平均準確率達96%。
成立至今已有8年的“中譯語通”是一家數據資產比重較大的技術企業(yè)。在其最近舉辦的年度峰會上,發(fā)布了智能搜索引擎NexMagic、數據可視化分析引擎DataMap4.0、智能構建知識圖譜Data Galaxy三款產品。中譯語通CEO于洋說,這是大數據和人工智能驅動作用下的技術應用成果,為大數據在語言領域的智能應用探索提供了新路徑。
數據驅動,技術讓語言更加智能
近年來,自動語音識別(ASR)技術發(fā)展迅猛。它作為人工智能領域中較為成熟的一項技術,語音和語言在大數據的海洋里更加智能,“出口成章”不再是夢想?,F在,ASR技術準確率根據各地語言的差異接近于90%,而深度學習技術所構建的深度神經網絡,使得語言翻譯產品更加智能化。
事實上,作為新的面向人工智能的交互方式,語音識別與合成技術在輸入法上已得到廣泛應用。2013年,中譯語通發(fā)布了一款名為“Yeehub”的多語言呼叫中心產品,全球12種語言24小時不間斷響應,每月可接收到來自全世界的呼叫分鐘數達到100萬,實現接通時間小于10秒。
曾經,自然語言理解、口音和方言、應用場景聲音、數據龐雜等多方面影響了語音識別和深度學習技術的迭代升級。于洋介紹說,隨著人工智能等新一代技術的發(fā)展,機器翻譯正經歷從基于統(tǒng)計規(guī)則的機器翻譯(SMT)向神經網絡機器翻譯(NMT)發(fā)展的變革時期。
“NMT是人工智能與機器翻譯技術的融合,對于自然語言理解更為精準,能夠提高溝通效率,將成為一項關鍵的AI技術?!庇谘笳f,中譯語通在大規(guī)模數據、深度整合高質量語料的基礎上,自主研發(fā)了深度學習框架訓練的語音識別引擎。中、英、日、韓、德、葡等每個語種積累了超過1萬小時的語音數據,中、英文語音識別的準確率已經超過90%,日、韓、德、葡語的識別準確率超過了80%。
據稱,這種精準的語音識別引擎已經運用于中譯語通推出的找翻譯APP、輸入法等多個語言科技產品?!拔磥?,我們要重點研發(fā)解決嘈雜環(huán)境、移動設備上的語音識別難題的產品,并不斷擴充語種,為全球不同語種、不同場合的用戶服務?!庇谘笳f。
創(chuàng)新突破,厚植產業(yè)核心競爭力
“地球村”越來越小。中譯語通發(fā)布的三款產品中,NexMagic將于本月底上線。這款基于人工智能和大數據技術自主研發(fā)的自然語言理解的搜索引擎產品,將在新聞資訊、科技、專利等領域實現垂直多語言搜索應用,可以將全球文本、語音、圖片、影像等數據匯集起來進行分析,構建知識圖譜。
“我們分拆出來的每一個垂直分類產品都是獨立的。比如醫(yī)療影像有獨立的團隊,我們只提供更多的資源支持和頂層設計。”于洋說,中譯語通在過去的三年時間里技術研發(fā)投入是非常大的?!拔覀冞€是能延伸出不同產品,基于整個大數據板塊,一旦有了新業(yè)務,預計會有的公司和團隊來運營它?!?/p>
作為跨語言、基于自然語言分析的搜索引擎產品,智能化的標志便是多語言語音識別和交互。中科院聲學研究所語言聲學與內容理解重點實驗室主任顏永紅表示,跨語言處理當前仍然面臨很多挑戰(zhàn),比如多語言數據獲取困難、語言差異導致各語言處理方法不同等。
事實上,作為一家擁有翻譯基因的技術公司,于洋更確信他們的產品特性有了大數據和人工智能技術基因。一系列不斷的創(chuàng)新突破,將為整個產業(yè)帶來變革性的影響。
業(yè)內分析人士表示,深度挖掘行業(yè)數據價值,以語音識別為代表的智能交互能力將成為引領移動終端和產業(yè)發(fā)展的核心驅動力?!耙詸C器翻譯、語音識別、計算機視覺、數據挖掘分享為代表的人工智能技術的演進,將給未來賦予了更多可能性,人工智能的終極目標是實現人機融合。”于洋最后說。(光明網)
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )