從智能家居、自動(dòng)駕駛到有聲讀物、虛擬主播,所有與人發(fā)生聯(lián)系的地方,聲音都成為了必要條件,語音交互更是成為諸多智能產(chǎn)品的標(biāo)配。智能終端設(shè)備的大規(guī)模爆發(fā),使得人與機(jī)器間的交互體驗(yàn)也被賦予更高期望——機(jī)器聲音要自然流暢、接近真人,這對(duì)具備TTS能力的智能服務(wù)提供商來說也是一場(chǎng)來自市場(chǎng)的檢驗(yàn)。
為了構(gòu)建更豐富的人機(jī)交互場(chǎng)景生態(tài),靈伴即時(shí)宣布面向全行業(yè)開放公測(cè)TTS2.0平臺(tái),這意味著各智能設(shè)備廠商、有聲產(chǎn)品、語音交互產(chǎn)品等都將有機(jī)會(huì)通過API輕松將業(yè)界領(lǐng)先的語音合成能力對(duì)接至自身產(chǎn)品,讓機(jī)器具備開口說話的能力。
靈伴TTS技術(shù)長(zhǎng)期以來受到業(yè)內(nèi)人士、客戶等多方認(rèn)可,屬于業(yè)界頂尖水平:
國(guó)際語音合成大賽冠亞軍
靈伴團(tuán)隊(duì)于2013年首次參加Blizzard Challenge國(guó)際語音合成大賽,便在自然度、相似度兩方面以絕對(duì)優(yōu)勢(shì)拿下綜合評(píng)測(cè)第一名的好成績(jī),被主辦方評(píng)定為語音合成領(lǐng)域第三次里程碑式技術(shù)突破;時(shí)隔6年靈伴再次參賽,自研的語音合成模型與算法獲得2019年度大賽亞軍,語音合成成果的可懂度在賽事所有團(tuán)隊(duì)相似度、自然度前十的隊(duì)伍中位列第一,占據(jù)絕對(duì)優(yōu)勢(shì)。
比擬真人的語音合成效果
在語音合成效果方面,靈伴獨(dú)創(chuàng)的高自然度韻律模型和音色學(xué)習(xí)方法,使得合成的發(fā)音更加自然、韻律更加流暢;SSML的合成方式,可實(shí)現(xiàn)對(duì)發(fā)音、分詞、停頓動(dòng)態(tài)精準(zhǔn)控制;這些都讓機(jī)器最終的發(fā)音更加接近真人,在與人的交互中更易被接受、更受歡迎。
中英文混讀能力
為滿足不同語境下的復(fù)雜需求,靈伴TTS能夠基于自研自動(dòng)語料生成模型進(jìn)行中英文混讀,大幅提升數(shù)據(jù)采集效率,無需進(jìn)行單獨(dú)英文合成,即可實(shí)現(xiàn)同一音色中英文混說功能,韻律自然、流暢,使機(jī)器真實(shí)還原人類日常中英文混說場(chǎng)景。
多場(chǎng)景語音風(fēng)格
靈伴TTS 2.0擁有全球最豐富中文合成音色庫(kù),包含男性、女性客服音色并分為甜美、氣質(zhì)、商務(wù)等多種風(fēng)格;并有兒童、明星、小說、新聞播報(bào)等多領(lǐng)域特色音色;其中多個(gè)音色經(jīng)由市場(chǎng)檢驗(yàn),已經(jīng)應(yīng)用于多個(gè)行業(yè)多個(gè)客服業(yè)務(wù)場(chǎng)景,完成了數(shù)以計(jì)億次人機(jī)交互,并收獲了用戶的一致好評(píng),此次開放后,企業(yè)或個(gè)人可按照自身需求選擇調(diào)用。
再頂尖的技術(shù)只有落地為產(chǎn)品才是它的價(jià)值所在,從智能服務(wù)提供商角度來說,對(duì)實(shí)際業(yè)務(wù)場(chǎng)景需求的深刻理解力是將技術(shù)轉(zhuǎn)化為產(chǎn)品的關(guān)鍵。此次開放公測(cè)的TTS 2.0平臺(tái)很好的詮釋了靈伴 “以用戶為中心”的產(chǎn)品理念:
彈性計(jì)費(fèi),高效對(duì)接,海量需求,輕松滿足
靈伴TTS2.0平臺(tái)采取以客戶成功為主的彈性計(jì)費(fèi)方式,費(fèi)用以實(shí)際播放時(shí)長(zhǎng)計(jì)算,可以最大程度幫助用戶省錢,合成播放時(shí)被打斷,未播放的部分不計(jì)入費(fèi)用;MRCP協(xié)議的方式,方便用戶高效對(duì)接,一次開發(fā),多種環(huán)境應(yīng)用;平臺(tái)中的云端語音合成引擎高效穩(wěn)定,支持海量并發(fā)合成請(qǐng)求,滿足用戶業(yè)務(wù)高增長(zhǎng)需求。
個(gè)性化聲音IP打造
個(gè)性化定制也是靈伴TTS2.0平臺(tái)為滿足市場(chǎng)多樣需求而開發(fā)的一項(xiàng)能力,先進(jìn)的語音合成模型,僅需數(shù)小時(shí)語料即可在短周期內(nèi)制作出優(yōu)質(zhì)、自然流暢、相似度高的音色,改變了傳統(tǒng)語音合成定制需要十小時(shí)以上語料數(shù)據(jù)并且對(duì)錄制環(huán)境要求極為嚴(yán)苛的方式,極大降低了用戶定制個(gè)性化聲音的門檻。
身為以人工智能技術(shù)為代表的新一輪新興技術(shù)的踐行者,靈伴一直懷揣著“技術(shù)普惠人類”的美好愿景,積極將新技術(shù)與產(chǎn)業(yè)實(shí)踐相結(jié)合,并已為招商銀行、中信銀行、華夏保險(xiǎn)、大地保險(xiǎn)、北京大學(xué)、海爾家電、獵聘等數(shù)十個(gè)行業(yè)的頭部客戶帶去了智能化升級(jí)體驗(yàn),助力數(shù)百家企業(yè)實(shí)現(xiàn)工業(yè)4.0時(shí)代的產(chǎn)業(yè)重構(gòu)。此次靈伴將自身優(yōu)質(zhì)的TTS能力開放給全行業(yè),亦是希望將優(yōu)質(zhì)的語音合成能力賦予更多企業(yè)、更多產(chǎn)品、更多場(chǎng)景,助力搭建更美好的行業(yè)生態(tài),讓更多人體驗(yàn)到智能的未來。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 亞馬遜CTO預(yù)測(cè):2025年及未來五大科技趨勢(shì),未來已來,你準(zhǔn)備好了嗎?
- 鴨鴨羽絨服與夢(mèng)餉科技攜手打造超級(jí)品牌日,GMV同比增長(zhǎng)300%,共贏新零售未來
- 中國(guó)客戶海外安全案件激增,2025年需應(yīng)對(duì)碎片化風(fēng)險(xiǎn):SOS報(bào)告揭示新挑戰(zhàn)
- 小米布局GPU集群,探索AI大模型新領(lǐng)域,科技巨頭引領(lǐng)未來趨勢(shì)
- 阿里影業(yè)入股姚安娜經(jīng)紀(jì)公司:新篇章,新機(jī)遇
- 螞蟻森林再度捐資河北種樹,共筑綠色長(zhǎng)城
- 谷歌不打算賤賣自家明星產(chǎn)品:Chrome瀏覽器
- 前體操運(yùn)動(dòng)員吳柳芳抖音賬號(hào)再遭封禁,副總裁回應(yīng):尊重規(guī)則,公正處理
- 李想談Robotaxi與人工智能超跑:理想不會(huì)盲目追求,2030年或推出深思熟慮之作
- 小米SU7冬季電車?yán)m(xù)航挑戰(zhàn):追求續(xù)航王之路,挑戰(zhàn)極限低溫
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。