原標(biāo)題:科大訊飛AI之路上的傳道授業(yè)解惑
2018年7月,科大訊飛發(fā)布了一款小程序應(yīng)用——訊飛留聲(微信搜索:訊飛留聲Lite)。這是一款免費(fèi)定制個(gè)人音庫的小程序,用戶根據(jù)引導(dǎo)錄制10句話樣本,10分鐘左右的時(shí)間,其深度學(xué)習(xí)模型就可以訓(xùn)練出用戶的完整音庫,從而能將任意文本轉(zhuǎn)換為用戶的聲音,且做到音色高保真還原,朗讀的語氣、語調(diào)、情感也堪比真人。
訊飛留聲是目前全球范圍內(nèi),用戶能體驗(yàn)到的最便捷、最成熟的個(gè)人音庫定制產(chǎn)品。相比之下,微軟和谷歌的同類型產(chǎn)品還停留在概念宣貫或內(nèi)測的階段,而國內(nèi)的人工智能公司更難望其項(xiàng)背。雖然訊飛留聲現(xiàn)階段還是一個(gè)測試版本,但隨著產(chǎn)品迭代,功能會逐步完善,應(yīng)用閉環(huán)生態(tài)也會慢慢成型。未來還有很多想象空間,但眼下,訊飛留聲的意義仿佛是讓一個(gè)只會模仿大人說話的小孩頓開心智,開啟自己的個(gè)性表達(dá)。
幾乎所有人都認(rèn)為,第三次AI浪潮將帶領(lǐng)我們進(jìn)入一個(gè)真正的人工智能世界。但人工智能并非新物種,它曾經(jīng)被冷落甚至夭折。這一次,它若能茁壯成長、健步如飛,一定離不開師者對其傳道授業(yè)解惑,科大訊飛正是這一角色。
科大訊飛從成立之初就堅(jiān)定了智能語音這一領(lǐng)域,19年堅(jiān)持源頭創(chuàng)新。智能語音對于AI行業(yè)來說,最直觀的理解是當(dāng)機(jī)器設(shè)備“能聽會說”時(shí),才具備智能的可能性。好比小孩子只有能聽懂指令,能表達(dá)想法才能開闊思維。訊飛在“教導(dǎo)”尚年幼的AI能聽會說方面的建樹也是有目共睹的。
經(jīng)過8年的成長,截至2018年6月,訊飛輸入法用戶數(shù)突破6億,語音識別率提升至98%,不僅做到一分鐘識別400字,還支持多語種實(shí)時(shí)語音翻譯、超長語音輸入、耳語輸入、離線語音輸入、方言輸入(目前訊飛輸入法支持23種方言,其中粵語、四川話、東北話等識別率均已超過90%)。此外,語音修改可以在使用語音輸入的過程中通過自然語言說出指令,進(jìn)行修改、添增、刪除文字等操作。通過訊飛開放平臺將語音識別的技術(shù)賦予行業(yè)伙伴,“能聽”為人工智能大步向前邁進(jìn)打下基礎(chǔ)。
“會說”方面,科大訊飛被公認(rèn)為全世界“最會說”的人工智能“嘴巴”。前不久結(jié)束的Blizzard Challenge 2018比賽中,科大訊飛報(bào)送的參賽系統(tǒng)摘得10個(gè)測評打分項(xiàng)目中的9項(xiàng)第一,成為“最全能的冠軍”(參賽者如果只獲得某一兩個(gè)單項(xiàng)的第一并不足謂冠軍)。這也是訊飛連續(xù)13年蟬聯(lián)該大賽冠軍。從2005年比賽誕生以來,尚無第二家機(jī)構(gòu)可以拿下13連冠,也沒有一家可以超越科大訊飛擁有的測評項(xiàng)目第一的數(shù)量。
語音合成涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),實(shí)現(xiàn)將文字信息轉(zhuǎn)化為可聽的聲音信息。Blizzard Challenge的評測項(xiàng)目共有4個(gè),分別是:相似度、自然度、錯(cuò)誤率、段落總體感覺。其中段落總體感覺又分為6個(gè)分項(xiàng):愉悅感、停頓節(jié)奏、重讀、聲調(diào)、情感、耐聽性。在這些方面,訊飛代表了當(dāng)今語音技術(shù)領(lǐng)域的世界一流水平。訊飛留聲正是按照Blizzard Challenge對語音合成的嚴(yán)苛要求打造的個(gè)人音庫定制平臺。難能可貴的是,這是全球首次將工業(yè)級解決方案精簡成普通消費(fèi)者能體驗(yàn)和應(yīng)用的軟件,讓普通人體驗(yàn)復(fù)刻自己聲音的奇妙之旅。
值得注意的是,這些成績單是訊飛“順便”取得的,或者說是技術(shù)創(chuàng)新下水到渠成的結(jié)果。訊飛深知,人工智能并不是搞軍備競賽,而是要在正確的方向上堅(jiān)持創(chuàng)新突破,并將領(lǐng)先于全球的核心能力,通過開放平臺賦予整個(gè)行業(yè)和所有從業(yè)者,形成良性生態(tài),共同攻克人工智能的難題,共同推進(jìn)人工智能的發(fā)展——這就是科大訊飛對于人工智能行業(yè)的傳道授業(yè)解惑!未來,科大訊飛會繼續(xù)引領(lǐng)行業(yè)方向,激發(fā)全行業(yè)的創(chuàng)新浪潮?;蛟SAI行業(yè)的百花齊放就是對行業(yè)良師的青出于藍(lán),也是這個(gè)行業(yè)能繁榮向前的教學(xué)相長。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。