從智能家居、自動(dòng)駕駛到有聲讀物、虛擬主播,所有與人發(fā)生聯(lián)系的地方,聲音都成為了必要條件,語(yǔ)音交互更是成為諸多智能產(chǎn)品的標(biāo)配。智能終端設(shè)備的大規(guī)模爆發(fā),使得人與機(jī)器間的交互體驗(yàn)也被賦予更高期望——機(jī)器聲音要自然流暢、接近真人,這對(duì)具備TTS能力的智能服務(wù)提供商來(lái)說(shuō)也是一場(chǎng)來(lái)自市場(chǎng)的檢驗(yàn)。
為了構(gòu)建更豐富的人機(jī)交互場(chǎng)景生態(tài),靈伴即時(shí)宣布面向全行業(yè)開(kāi)放公測(cè)TTS2.0平臺(tái),這意味著各智能設(shè)備廠商、有聲產(chǎn)品、語(yǔ)音交互產(chǎn)品等都將有機(jī)會(huì)通過(guò)API輕松將業(yè)界領(lǐng)先的語(yǔ)音合成能力對(duì)接至自身產(chǎn)品,讓機(jī)器具備開(kāi)口說(shuō)話的能力。
靈伴T(mén)TS技術(shù)長(zhǎng)期以來(lái)受到業(yè)內(nèi)人士、客戶等多方認(rèn)可,屬于業(yè)界頂尖水平:
國(guó)際語(yǔ)音合成大賽冠亞軍
靈伴團(tuán)隊(duì)于2013年首次參加Blizzard Challenge國(guó)際語(yǔ)音合成大賽,便在自然度、相似度兩方面以絕對(duì)優(yōu)勢(shì)拿下綜合評(píng)測(cè)第一名的好成績(jī),被主辦方評(píng)定為語(yǔ)音合成領(lǐng)域第三次里程碑式技術(shù)突破;時(shí)隔6年靈伴再次參賽,自研的語(yǔ)音合成模型與算法獲得2019年度大賽亞軍,語(yǔ)音合成成果的可懂度在賽事所有團(tuán)隊(duì)相似度、自然度前十的隊(duì)伍中位列第一,占據(jù)絕對(duì)優(yōu)勢(shì)。
比擬真人的語(yǔ)音合成效果
在語(yǔ)音合成效果方面,靈伴獨(dú)創(chuàng)的高自然度韻律模型和音色學(xué)習(xí)方法,使得合成的發(fā)音更加自然、韻律更加流暢;SSML的合成方式,可實(shí)現(xiàn)對(duì)發(fā)音、分詞、停頓動(dòng)態(tài)精準(zhǔn)控制;這些都讓機(jī)器最終的發(fā)音更加接近真人,在與人的交互中更易被接受、更受歡迎。
中英文混讀能力
為滿足不同語(yǔ)境下的復(fù)雜需求,靈伴T(mén)TS能夠基于自研自動(dòng)語(yǔ)料生成模型進(jìn)行中英文混讀,大幅提升數(shù)據(jù)采集效率,無(wú)需進(jìn)行單獨(dú)英文合成,即可實(shí)現(xiàn)同一音色中英文混說(shuō)功能,韻律自然、流暢,使機(jī)器真實(shí)還原人類(lèi)日常中英文混說(shuō)場(chǎng)景。
多場(chǎng)景語(yǔ)音風(fēng)格
靈伴T(mén)TS 2.0擁有全球最豐富中文合成音色庫(kù),包含男性、女性客服音色并分為甜美、氣質(zhì)、商務(wù)等多種風(fēng)格;并有兒童、明星、小說(shuō)、新聞播報(bào)等多領(lǐng)域特色音色;其中多個(gè)音色經(jīng)由市場(chǎng)檢驗(yàn),已經(jīng)應(yīng)用于多個(gè)行業(yè)多個(gè)客服業(yè)務(wù)場(chǎng)景,完成了數(shù)以計(jì)億次人機(jī)交互,并收獲了用戶的一致好評(píng),此次開(kāi)放后,企業(yè)或個(gè)人可按照自身需求選擇調(diào)用。
再頂尖的技術(shù)只有落地為產(chǎn)品才是它的價(jià)值所在,從智能服務(wù)提供商角度來(lái)說(shuō),對(duì)實(shí)際業(yè)務(wù)場(chǎng)景需求的深刻理解力是將技術(shù)轉(zhuǎn)化為產(chǎn)品的關(guān)鍵。此次開(kāi)放公測(cè)的TTS 2.0平臺(tái)很好的詮釋了靈伴 “以用戶為中心”的產(chǎn)品理念:
彈性計(jì)費(fèi),高效對(duì)接,海量需求,輕松滿足
靈伴T(mén)TS2.0平臺(tái)采取以客戶成功為主的彈性計(jì)費(fèi)方式,費(fèi)用以實(shí)際播放時(shí)長(zhǎng)計(jì)算,可以最大程度幫助用戶省錢(qián),合成播放時(shí)被打斷,未播放的部分不計(jì)入費(fèi)用;MRCP協(xié)議的方式,方便用戶高效對(duì)接,一次開(kāi)發(fā),多種環(huán)境應(yīng)用;平臺(tái)中的云端語(yǔ)音合成引擎高效穩(wěn)定,支持海量并發(fā)合成請(qǐng)求,滿足用戶業(yè)務(wù)高增長(zhǎng)需求。
個(gè)性化聲音IP打造
個(gè)性化定制也是靈伴T(mén)TS2.0平臺(tái)為滿足市場(chǎng)多樣需求而開(kāi)發(fā)的一項(xiàng)能力,先進(jìn)的語(yǔ)音合成模型,僅需數(shù)小時(shí)語(yǔ)料即可在短周期內(nèi)制作出優(yōu)質(zhì)、自然流暢、相似度高的音色,改變了傳統(tǒng)語(yǔ)音合成定制需要十小時(shí)以上語(yǔ)料數(shù)據(jù)并且對(duì)錄制環(huán)境要求極為嚴(yán)苛的方式,極大降低了用戶定制個(gè)性化聲音的門(mén)檻。
身為以人工智能技術(shù)為代表的新一輪新興技術(shù)的踐行者,靈伴一直懷揣著“技術(shù)普惠人類(lèi)”的美好愿景,積極將新技術(shù)與產(chǎn)業(yè)實(shí)踐相結(jié)合,并已為招商銀行、中信銀行、華夏保險(xiǎn)、大地保險(xiǎn)、北京大學(xué)、海爾家電、獵聘等數(shù)十個(gè)行業(yè)的頭部客戶帶去了智能化升級(jí)體驗(yàn),助力數(shù)百家企業(yè)實(shí)現(xiàn)工業(yè)4.0時(shí)代的產(chǎn)業(yè)重構(gòu)。此次靈伴將自身優(yōu)質(zhì)的TTS能力開(kāi)放給全行業(yè),亦是希望將優(yōu)質(zhì)的語(yǔ)音合成能力賦予更多企業(yè)、更多產(chǎn)品、更多場(chǎng)景,助力搭建更美好的行業(yè)生態(tài),讓更多人體驗(yàn)到智能的未來(lái)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 比亞迪第五代DM技術(shù)問(wèn)世,首搭秦L/海豹06 DM-i,開(kāi)創(chuàng)油耗2時(shí)代!
- 小紅書(shū)沉帖降權(quán)怎么做,有效方法大盤(pán)點(diǎn)!
- 亞洲時(shí)刻京東送上電視好禮 以舊換新一體化服務(wù)讓低價(jià)更靠譜
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師和全媒體運(yùn)營(yíng)師的區(qū)別?
- 聯(lián)想集團(tuán)車(chē)計(jì)算“超級(jí)大腦”概念機(jī)亮相
- 華策影視設(shè)立專(zhuān)項(xiàng)基金成立AIGC應(yīng)用研究院
- 三部委審批,聯(lián)合發(fā)布9個(gè)新職業(yè),“互聯(lián)網(wǎng)營(yíng)銷(xiāo)師”上榜
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師的報(bào)考條件是什么?
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師的適合人群有哪些?
- 互聯(lián)網(wǎng)營(yíng)銷(xiāo)師行業(yè)前景怎么樣?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。