原標題:科大訊飛AI之路上的傳道授業(yè)解惑
2018年7月,科大訊飛發(fā)布了一款小程序應用——訊飛留聲(微信搜索:訊飛留聲Lite)。這是一款免費定制個人音庫的小程序,用戶根據引導錄制10句話樣本,10分鐘左右的時間,其深度學習模型就可以訓練出用戶的完整音庫,從而能將任意文本轉換為用戶的聲音,且做到音色高保真還原,朗讀的語氣、語調、情感也堪比真人。
訊飛留聲是目前全球范圍內,用戶能體驗到的最便捷、最成熟的個人音庫定制產品。相比之下,微軟和谷歌的同類型產品還停留在概念宣貫或內測的階段,而國內的人工智能公司更難望其項背。雖然訊飛留聲現階段還是一個測試版本,但隨著產品迭代,功能會逐步完善,應用閉環(huán)生態(tài)也會慢慢成型。未來還有很多想象空間,但眼下,訊飛留聲的意義仿佛是讓一個只會模仿大人說話的小孩頓開心智,開啟自己的個性表達。
幾乎所有人都認為,第三次AI浪潮將帶領我們進入一個真正的人工智能世界。但人工智能并非新物種,它曾經被冷落甚至夭折。這一次,它若能茁壯成長、健步如飛,一定離不開師者對其傳道授業(yè)解惑,科大訊飛正是這一角色。
科大訊飛從成立之初就堅定了智能語音這一領域,19年堅持源頭創(chuàng)新。智能語音對于AI行業(yè)來說,最直觀的理解是當機器設備“能聽會說”時,才具備智能的可能性。好比小孩子只有能聽懂指令,能表達想法才能開闊思維。訊飛在“教導”尚年幼的AI能聽會說方面的建樹也是有目共睹的。
經過8年的成長,截至2018年6月,訊飛輸入法用戶數突破6億,語音識別率提升至98%,不僅做到一分鐘識別400字,還支持多語種實時語音翻譯、超長語音輸入、耳語輸入、離線語音輸入、方言輸入(目前訊飛輸入法支持23種方言,其中粵語、四川話、東北話等識別率均已超過90%)。此外,語音修改可以在使用語音輸入的過程中通過自然語言說出指令,進行修改、添增、刪除文字等操作。通過訊飛開放平臺將語音識別的技術賦予行業(yè)伙伴,“能聽”為人工智能大步向前邁進打下基礎。
“會說”方面,科大訊飛被公認為全世界“最會說”的人工智能“嘴巴”。前不久結束的Blizzard Challenge 2018比賽中,科大訊飛報送的參賽系統(tǒng)摘得10個測評打分項目中的9項第一,成為“最全能的冠軍”(參賽者如果只獲得某一兩個單項的第一并不足謂冠軍)。這也是訊飛連續(xù)13年蟬聯該大賽冠軍。從2005年比賽誕生以來,尚無第二家機構可以拿下13連冠,也沒有一家可以超越科大訊飛擁有的測評項目第一的數量。
語音合成涉及聲學、語言學、數字信號處理、計算機科學等多個學科技術,實現將文字信息轉化為可聽的聲音信息。Blizzard Challenge的評測項目共有4個,分別是:相似度、自然度、錯誤率、段落總體感覺。其中段落總體感覺又分為6個分項:愉悅感、停頓節(jié)奏、重讀、聲調、情感、耐聽性。在這些方面,訊飛代表了當今語音技術領域的世界一流水平。訊飛留聲正是按照Blizzard Challenge對語音合成的嚴苛要求打造的個人音庫定制平臺。難能可貴的是,這是全球首次將工業(yè)級解決方案精簡成普通消費者能體驗和應用的軟件,讓普通人體驗復刻自己聲音的奇妙之旅。
值得注意的是,這些成績單是訊飛“順便”取得的,或者說是技術創(chuàng)新下水到渠成的結果。訊飛深知,人工智能并不是搞軍備競賽,而是要在正確的方向上堅持創(chuàng)新突破,并將領先于全球的核心能力,通過開放平臺賦予整個行業(yè)和所有從業(yè)者,形成良性生態(tài),共同攻克人工智能的難題,共同推進人工智能的發(fā)展——這就是科大訊飛對于人工智能行業(yè)的傳道授業(yè)解惑!未來,科大訊飛會繼續(xù)引領行業(yè)方向,激發(fā)全行業(yè)的創(chuàng)新浪潮。或許AI行業(yè)的百花齊放就是對行業(yè)良師的青出于藍,也是這個行業(yè)能繁榮向前的教學相長。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 華為研發(fā)中心入駐上海青浦致小鎮(zhèn)房租大漲,帶動周邊租房市場熱潮
- 華為員工涌入蘇滬兩地,房東狂歡:租金幾近翻倍,跨省租房成新常態(tài)
- 制造業(yè)巨頭空客計劃裁員2500人,應對航天業(yè)務虧損與供應鏈挑戰(zhàn)
- 科技創(chuàng)新引領產業(yè)發(fā)展:江陰市與清華大學攜手推進重大科技項目
- 美國或再升級出口管制:考慮限制AI芯片對中東出口
- 劉強東章澤天報案:京東發(fā)言人證實夫婦倆遭有組織造謠,警方已介入
- 東方甄選擬15億出售教育業(yè)務
- 虧764億上熱搜 蔚來裁員10%,銷量跌出前三
- IBM設立5億元AI創(chuàng)投基金
- 聯想發(fā)布 ThinkStation P8工作站
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。