(搜狗王小川在香港RISE科技峰會上展示虛擬主播)
2018年7月11日,央視主播“姚雪松”播報香港RISE科技峰會相關(guān)新聞的視頻出現(xiàn)在主演講臺上方的大屏幕上。
他來了么?沒來,是搜狗的王小川帶“他“來的。這是全球首個虛擬主播。
搜狗使用姚雪松1.5小時的音視頻數(shù)據(jù),結(jié)合語音、圖像等多模態(tài)信息進(jìn)行聯(lián)合建模訓(xùn)練,輸入一段RISE大會的文字稿,可以快速預(yù)測生成與真人無異的播報效果。
機(jī)器能夠以“人”的形象如此輕松地播報新聞,背后是搜狗多年以來在AI上積累的技術(shù)實力。 7月份搜狗在Blizzard Challenge 2018上獲得語音合成大賽冠軍,而在上個月,搜狗的視覺研究團(tuán)隊獲得了CVPR WAD2018 挑戰(zhàn)賽冠軍,早在去年,搜狗在機(jī)器翻譯領(lǐng)域就已經(jīng)取得突破,在WMT2017收獲冠軍,頻頻獲獎的同時,各項AI技術(shù)不斷推出,并逐步落地,搜狗的語音識別準(zhǔn)確率已超98%,日均語音輸入調(diào)用次數(shù)峰值達(dá)4億次;唇語識別在垂直應(yīng)用領(lǐng)域中的準(zhǔn)確率超90%,以語言為核心,搜狗已逐步建立起獨一無二的人工智能數(shù)據(jù)和技術(shù)壁壘。
提及本次發(fā)布的虛擬主播的技術(shù)難點,該項目的技術(shù)負(fù)責(zé)人表示:“最大的難點在于,讓機(jī)器僅使用一段文本,來預(yù)測生成逼真度極高的視頻,要保持視頻中主播的音頻和臉部表情、唇動能夠自然且一致,做到如此逼真非常難。”目前市面上還沒有類似的產(chǎn)品,通過領(lǐng)先業(yè)界的語音合成和圖像生成技術(shù),搜狗率先實現(xiàn)了虛擬主播目前的逼真效果。
虛擬主播在技術(shù)上的實現(xiàn)意味著AI具有了更豐富的表達(dá)方式,從文字表達(dá)走向音視頻的富媒體表達(dá)。
虛擬主播技術(shù)的應(yīng)用場景非常廣泛。首先,作為具備視頻內(nèi)容生產(chǎn)能力的一項技術(shù),該技術(shù)可以運用在諸如新聞、媒體內(nèi)容等場景中,自動實時快捷地生成富媒體內(nèi)容。
其次,虛擬主播技術(shù)還能根據(jù)用戶上傳的單張人物圖片(明星、朋友、家人等)實時生成該人物的虛擬主播形象,用戶可以與其面對面交流。
結(jié)合搜狗語音交互系統(tǒng)知音OS能力,我們可以讓虛擬主播具備交互能力,使得該項技術(shù)可以應(yīng)用于教育、醫(yī)療、客服等多個行業(yè),節(jié)約大量的人力成本。如果用于教育行業(yè),虛擬主播可以成為脾氣很好的老師,不厭其煩地一遍一遍幫助用戶進(jìn)行發(fā)音口型指導(dǎo)。
此外,還可以應(yīng)用于各種具備交互能力的智能軟硬件。如果用于帶屏幕的智能音箱,虛擬主播就可以發(fā)展成為虛擬私人助理,用戶可以從單純與聲音的交互變成與一個逼真的虛擬人物的交互。
虛擬主播可能還會催生具有情感的交互App,比如幫助粉絲和愛豆實現(xiàn)“面對面”交互的追星App;上傳用戶自己喜歡的形象,結(jié)合搜狗的問答技術(shù),可以與之進(jìn)行定制化問答的陪伴App等。
虛擬主播究竟會以何種方式滲入我們?nèi)祟惖纳钌胁豢芍?,或許有一天將打破次元壁和時空無處不在;未來,不管是銀行服務(wù),還是電視節(jié)目,或是演唱會上的嘉賓,或許都可以看到它們的身影。
這位技術(shù)人員說:“后續(xù),除了優(yōu)先提升人機(jī)交互的體驗外,我們也會繼續(xù)優(yōu)化虛擬主播的真實感,并在虛擬主播情感表達(dá)上做更加深入的研究。”
他解釋說搜狗這次展示的虛擬主播還沒有添加“情感”,還顯得比較生硬。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- AI超跑新秀揭秘:理想或?qū)⑸孀愣虅☆I(lǐng)域,廣電部門嚴(yán)查紅果短劇風(fēng)波
- 紅果短劇回應(yīng)被約談:5天內(nèi)暫停新劇上線,積極整改,重樹內(nèi)容標(biāo)準(zhǔn)
- 互聯(lián)網(wǎng)大廠春節(jié)福利揭秘:高薪休假與日常福利究竟誰更勝一籌?
- 亞馬遜CTO預(yù)測:2025年及未來五大科技趨勢,未來已來,你準(zhǔn)備好了嗎?
- 鴨鴨羽絨服與夢餉科技攜手打造超級品牌日,GMV同比增長300%,共贏新零售未來
- 中國客戶海外安全案件激增,2025年需應(yīng)對碎片化風(fēng)險:SOS報告揭示新挑戰(zhàn)
- 小米布局GPU集群,探索AI大模型新領(lǐng)域,科技巨頭引領(lǐng)未來趨勢
- 阿里影業(yè)入股姚安娜經(jīng)紀(jì)公司:新篇章,新機(jī)遇
- 螞蟻森林再度捐資河北種樹,共筑綠色長城
- 谷歌不打算賤賣自家明星產(chǎn)品:Chrome瀏覽器
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。