原標(biāo)題:科大訊飛AI之路上的傳道授業(yè)解惑
2018年7月,科大訊飛發(fā)布了一款小程序應(yīng)用——訊飛留聲(微信搜索:訊飛留聲Lite)。這是一款免費(fèi)定制個(gè)人音庫(kù)的小程序,用戶(hù)根據(jù)引導(dǎo)錄制10句話樣本,10分鐘左右的時(shí)間,其深度學(xué)習(xí)模型就可以訓(xùn)練出用戶(hù)的完整音庫(kù),從而能將任意文本轉(zhuǎn)換為用戶(hù)的聲音,且做到音色高保真還原,朗讀的語(yǔ)氣、語(yǔ)調(diào)、情感也堪比真人。
訊飛留聲是目前全球范圍內(nèi),用戶(hù)能體驗(yàn)到的最便捷、最成熟的個(gè)人音庫(kù)定制產(chǎn)品。相比之下,微軟和谷歌的同類(lèi)型產(chǎn)品還停留在概念宣貫或內(nèi)測(cè)的階段,而國(guó)內(nèi)的人工智能公司更難望其項(xiàng)背。雖然訊飛留聲現(xiàn)階段還是一個(gè)測(cè)試版本,但隨著產(chǎn)品迭代,功能會(huì)逐步完善,應(yīng)用閉環(huán)生態(tài)也會(huì)慢慢成型。未來(lái)還有很多想象空間,但眼下,訊飛留聲的意義仿佛是讓一個(gè)只會(huì)模仿大人說(shuō)話的小孩頓開(kāi)心智,開(kāi)啟自己的個(gè)性表達(dá)。
幾乎所有人都認(rèn)為,第三次AI浪潮將帶領(lǐng)我們進(jìn)入一個(gè)真正的人工智能世界。但人工智能并非新物種,它曾經(jīng)被冷落甚至夭折。這一次,它若能茁壯成長(zhǎng)、健步如飛,一定離不開(kāi)師者對(duì)其傳道授業(yè)解惑,科大訊飛正是這一角色。
科大訊飛從成立之初就堅(jiān)定了智能語(yǔ)音這一領(lǐng)域,19年堅(jiān)持源頭創(chuàng)新。智能語(yǔ)音對(duì)于AI行業(yè)來(lái)說(shuō),最直觀的理解是當(dāng)機(jī)器設(shè)備“能聽(tīng)會(huì)說(shuō)”時(shí),才具備智能的可能性。好比小孩子只有能聽(tīng)懂指令,能表達(dá)想法才能開(kāi)闊思維。訊飛在“教導(dǎo)”尚年幼的AI能聽(tīng)會(huì)說(shuō)方面的建樹(shù)也是有目共睹的。
經(jīng)過(guò)8年的成長(zhǎng),截至2018年6月,訊飛輸入法用戶(hù)數(shù)突破6億,語(yǔ)音識(shí)別率提升至98%,不僅做到一分鐘識(shí)別400字,還支持多語(yǔ)種實(shí)時(shí)語(yǔ)音翻譯、超長(zhǎng)語(yǔ)音輸入、耳語(yǔ)輸入、離線語(yǔ)音輸入、方言輸入(目前訊飛輸入法支持23種方言,其中粵語(yǔ)、四川話、東北話等識(shí)別率均已超過(guò)90%)。此外,語(yǔ)音修改可以在使用語(yǔ)音輸入的過(guò)程中通過(guò)自然語(yǔ)言說(shuō)出指令,進(jìn)行修改、添增、刪除文字等操作。通過(guò)訊飛開(kāi)放平臺(tái)將語(yǔ)音識(shí)別的技術(shù)賦予行業(yè)伙伴,“能聽(tīng)”為人工智能大步向前邁進(jìn)打下基礎(chǔ)。
“會(huì)說(shuō)”方面,科大訊飛被公認(rèn)為全世界“最會(huì)說(shuō)”的人工智能“嘴巴”。前不久結(jié)束的Blizzard Challenge 2018比賽中,科大訊飛報(bào)送的參賽系統(tǒng)摘得10個(gè)測(cè)評(píng)打分項(xiàng)目中的9項(xiàng)第一,成為“最全能的冠軍”(參賽者如果只獲得某一兩個(gè)單項(xiàng)的第一并不足謂冠軍)。這也是訊飛連續(xù)13年蟬聯(lián)該大賽冠軍。從2005年比賽誕生以來(lái),尚無(wú)第二家機(jī)構(gòu)可以拿下13連冠,也沒(méi)有一家可以超越科大訊飛擁有的測(cè)評(píng)項(xiàng)目第一的數(shù)量。
語(yǔ)音合成涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),實(shí)現(xiàn)將文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息。Blizzard Challenge的評(píng)測(cè)項(xiàng)目共有4個(gè),分別是:相似度、自然度、錯(cuò)誤率、段落總體感覺(jué)。其中段落總體感覺(jué)又分為6個(gè)分項(xiàng):愉悅感、停頓節(jié)奏、重讀、聲調(diào)、情感、耐聽(tīng)性。在這些方面,訊飛代表了當(dāng)今語(yǔ)音技術(shù)領(lǐng)域的世界一流水平。訊飛留聲正是按照Blizzard Challenge對(duì)語(yǔ)音合成的嚴(yán)苛要求打造的個(gè)人音庫(kù)定制平臺(tái)。難能可貴的是,這是全球首次將工業(yè)級(jí)解決方案精簡(jiǎn)成普通消費(fèi)者能體驗(yàn)和應(yīng)用的軟件,讓普通人體驗(yàn)復(fù)刻自己聲音的奇妙之旅。
值得注意的是,這些成績(jī)單是訊飛“順便”取得的,或者說(shuō)是技術(shù)創(chuàng)新下水到渠成的結(jié)果。訊飛深知,人工智能并不是搞軍備競(jìng)賽,而是要在正確的方向上堅(jiān)持創(chuàng)新突破,并將領(lǐng)先于全球的核心能力,通過(guò)開(kāi)放平臺(tái)賦予整個(gè)行業(yè)和所有從業(yè)者,形成良性生態(tài),共同攻克人工智能的難題,共同推進(jìn)人工智能的發(fā)展——這就是科大訊飛對(duì)于人工智能行業(yè)的傳道授業(yè)解惑!未來(lái),科大訊飛會(huì)繼續(xù)引領(lǐng)行業(yè)方向,激發(fā)全行業(yè)的創(chuàng)新浪潮。或許AI行業(yè)的百花齊放就是對(duì)行業(yè)良師的青出于藍(lán),也是這個(gè)行業(yè)能繁榮向前的教學(xué)相長(zhǎng)。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋(píng)果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢(qián)通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱(chēng)塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋(píng)果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車(chē)整車(chē)股盤(pán)初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。