王小川攜虛擬主播亮相RISE大會 開可視化語音合成先河

王小川攜虛擬主播亮相RISE大會 開可視化語音合成先河

(搜狗王小川在香港RISE科技峰會上展示虛擬主播)

2018年7月11日,央視主播“姚雪松”播報香港RISE科技峰會相關(guān)新聞的視頻出現(xiàn)在主演講臺上方的大屏幕上。

他來了么?沒來,是搜狗的王小川帶“他“來的。這是全球首個虛擬主播。

搜狗使用姚雪松1.5小時的音視頻數(shù)據(jù),結(jié)合語音、圖像等多模態(tài)信息進(jìn)行聯(lián)合建模訓(xùn)練,輸入一段RISE大會的文字稿,可以快速預(yù)測生成與真人無異的播報效果。

王小川攜虛擬主播亮相RISE大會 開可視化語音合成先河

機(jī)器能夠以“人”的形象如此輕松地播報新聞,背后是搜狗多年以來在AI上積累的技術(shù)實力。 7月份搜狗在Blizzard Challenge 2018上獲得語音合成大賽冠軍,而在上個月,搜狗的視覺研究團(tuán)隊獲得了CVPR WAD2018 挑戰(zhàn)賽冠軍,早在去年,搜狗在機(jī)器翻譯領(lǐng)域就已經(jīng)取得突破,在WMT2017收獲冠軍,頻頻獲獎的同時,各項AI技術(shù)不斷推出,并逐步落地,搜狗的語音識別準(zhǔn)確率已超98%,日均語音輸入調(diào)用次數(shù)峰值達(dá)4億次;唇語識別在垂直應(yīng)用領(lǐng)域中的準(zhǔn)確率超90%,以語言為核心,搜狗已逐步建立起獨一無二的人工智能數(shù)據(jù)和技術(shù)壁壘。

提及本次發(fā)布的虛擬主播的技術(shù)難點,該項目的技術(shù)負(fù)責(zé)人表示:“最大的難點在于,讓機(jī)器僅使用一段文本,來預(yù)測生成逼真度極高的視頻,要保持視頻中主播的音頻和臉部表情、唇動能夠自然且一致,做到如此逼真非常難。”目前市面上還沒有類似的產(chǎn)品,通過領(lǐng)先業(yè)界的語音合成和圖像生成技術(shù),搜狗率先實現(xiàn)了虛擬主播目前的逼真效果。

虛擬主播在技術(shù)上的實現(xiàn)意味著AI具有了更豐富的表達(dá)方式,從文字表達(dá)走向音視頻的富媒體表達(dá)。

虛擬主播技術(shù)的應(yīng)用場景非常廣泛。首先,作為具備視頻內(nèi)容生產(chǎn)能力的一項技術(shù),該技術(shù)可以運用在諸如新聞、媒體內(nèi)容等場景中,自動實時快捷地生成富媒體內(nèi)容。

其次,虛擬主播技術(shù)還能根據(jù)用戶上傳的單張人物圖片(明星、朋友、家人等)實時生成該人物的虛擬主播形象,用戶可以與其面對面交流。

結(jié)合搜狗語音交互系統(tǒng)知音OS能力,我們可以讓虛擬主播具備交互能力,使得該項技術(shù)可以應(yīng)用于教育、醫(yī)療、客服等多個行業(yè),節(jié)約大量的人力成本。如果用于教育行業(yè),虛擬主播可以成為脾氣很好的老師,不厭其煩地一遍一遍幫助用戶進(jìn)行發(fā)音口型指導(dǎo)。

此外,還可以應(yīng)用于各種具備交互能力的智能軟硬件。如果用于帶屏幕的智能音箱,虛擬主播就可以發(fā)展成為虛擬私人助理,用戶可以從單純與聲音的交互變成與一個逼真的虛擬人物的交互。

虛擬主播可能還會催生具有情感的交互App,比如幫助粉絲和愛豆實現(xiàn)“面對面”交互的追星App;上傳用戶自己喜歡的形象,結(jié)合搜狗的問答技術(shù),可以與之進(jìn)行定制化問答的陪伴App等。

虛擬主播究竟會以何種方式滲入我們?nèi)祟惖纳钌胁豢芍?,或許有一天將打破次元壁和時空無處不在;未來,不管是銀行服務(wù),還是電視節(jié)目,或是演唱會上的嘉賓,或許都可以看到它們的身影。

這位技術(shù)人員說:“后續(xù),除了優(yōu)先提升人機(jī)交互的體驗外,我們也會繼續(xù)優(yōu)化虛擬主播的真實感,并在虛擬主播情感表達(dá)上做更加深入的研究。”

他解釋說搜狗這次展示的虛擬主播還沒有添加“情感”,還顯得比較生硬。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-13
王小川攜虛擬主播亮相RISE大會 開可視化語音合成先河
(搜狗王小川在香港RISE科技峰會上展示虛擬主播)2018年7月11日,央視主播“姚雪松”播報香港RISE科技峰會相關(guān)新聞的視頻出現(xiàn)在主

長按掃碼 閱讀全文