AI突破新邊界王小川在香港亮出全球首個(gè)虛擬主播

有著"科技界達(dá)沃斯"之稱的Web Summit團(tuán)隊(duì)來到香港,開啟了為期四天的RISE科技大會(huì)。包括微軟總裁Brad Smith、亞馬遜CTOWerner Vogels在內(nèi)的上百位全球頂級(jí)科技企業(yè)高管和先鋒創(chuàng)業(yè)者齊聚一堂,就人工智能、大數(shù)據(jù)、區(qū)塊鏈等時(shí)下熱門主題,進(jìn)行思想和靈感的交流,分享全球科技領(lǐng)域最新發(fā)展情況。

2018年7月11日,搜狗CEO王小川作為國內(nèi)AI領(lǐng)軍人物代表,受邀出席此次峰會(huì)并進(jìn)行了題為《人工智能的下一個(gè)應(yīng)用突破》的演講,分享了他對(duì)"人工智能的意義"、"語言與AI的關(guān)系"等問題的新銳思考,并通過多款產(chǎn)品全面秀出了搜狗的"AI肌肉"。

AI突破新邊界王小川在香港亮出全球首個(gè)虛擬主播

  (圖1:搜狗CEO在RISE大會(huì)發(fā)表演講)

自然交互+知識(shí)計(jì)算 搜狗的語言AI版圖

在王小川看來,“語言”是AI的未來,“掌握一種語言就是掌握了一種靈魂”,而語言則是人工智能皇冠上的明珠。無論是百箱大戰(zhàn)中Amazon Echo、GoogleHome等多款圍繞著語音交互打造的智能音箱,還是會(huì)打電話的Google Duplex、會(huì)辯論的IBMProjector Debater,都聚焦于讓機(jī)器擁有“語言”這顆明珠。

搜狗以“讓表達(dá)與獲取信息更簡單”為使命,多年堅(jiān)持以語言為核心,圍繞于自然交互和知識(shí)計(jì)算兩大方向,在語音、圖像、翻譯等語言類AI技術(shù)上不斷突破。王小川認(rèn)為,通過自然交互,人與機(jī)器能夠更自由地表達(dá);通過知識(shí)計(jì)算,讓機(jī)器來幫助人類,實(shí)現(xiàn)智能的體外進(jìn)化。

在自然交互版塊,搜狗不斷在語音識(shí)別和語音合成方面進(jìn)行開拓創(chuàng)新。搜狗輸入法是中國最大的語音輸入法,目前語音識(shí)別準(zhǔn)確率已超98%;日均語音輸入調(diào)用次數(shù)峰值達(dá)4億次;支持外文多語種和中文方言識(shí)別;智能斷句、標(biāo)點(diǎn)預(yù)測、識(shí)別結(jié)果順滑等功能也領(lǐng)先于業(yè)界。語音合成支持多種音色選擇,通過少量數(shù)據(jù)即可生成說話者自己的合成音色,還可實(shí)現(xiàn)說話人風(fēng)格的遷移。

王小川現(xiàn)場展示了用“王小川講話訓(xùn)練數(shù)據(jù)”,結(jié)合龐麥郎的《我的滑板鞋》歌曲素材,經(jīng)機(jī)器進(jìn)行語音識(shí)別、語音合成后,生成王小川版的《我的滑板鞋》。這版歌曲中既包含了歌曲的曲調(diào)和節(jié)奏,也融入了王小川的聲線及語言風(fēng)格,生動(dòng)有趣地呈現(xiàn)了搜狗語音合成和情感遷移技術(shù)。

AI突破新邊界王小川在香港亮出全球首個(gè)虛擬主播

  (圖2:搜狗CEO王小川現(xiàn)場展示語音合成與情感遷移技術(shù))

虛擬主播生動(dòng)播報(bào)RISE新聞 搜狗語音技術(shù)的最新嘗試

在此次活動(dòng)上,王小川展示了搜狗推出的全球首個(gè)高度實(shí)用化、定制化的虛擬主播。結(jié)合唇語合成、語音合成、音視頻聯(lián)合建模與深度學(xué)習(xí)技術(shù),可驅(qū)動(dòng)機(jī)器生成對(duì)應(yīng)的唇語圖像與聲音,進(jìn)而輸出統(tǒng)一的音視頻素材。此次展示的虛擬主播,是搜狗使用央視新聞主播姚雪松數(shù)十個(gè)小時(shí)的音視頻素材進(jìn)行訓(xùn)練與計(jì)算的結(jié)果,最終生成了一段音視頻同步的RISE大會(huì)新聞播報(bào),與真人播報(bào)無異。

AI突破新邊界王小川在香港亮出全球首個(gè)虛擬主播

  (圖3:虛擬主播新聞播報(bào)畫面)

AI技術(shù)為搜狗全線產(chǎn)品賦能 問答、對(duì)話、翻譯是搜狗的產(chǎn)品方向

除了新產(chǎn)品外,搜狗已讓AI技術(shù)為搜狗的全線產(chǎn)品賦能,無論是搜狗搜索,還是搜狗輸入法,都做到了更懂用戶,給出的選項(xiàng)和推薦也能直搗用戶內(nèi)心的需求。王小川認(rèn)為,AI時(shí)代企業(yè)要做的不是多面開花,而是應(yīng)該認(rèn)準(zhǔn)戰(zhàn)略方向讓技術(shù)有的放矢。

對(duì)于未來,王小川的判斷是:搜索會(huì)升級(jí)為問答,輸入法會(huì)演化成輔助對(duì)話系統(tǒng)。當(dāng)輸入關(guān)鍵詞或問句后,搜索引擎將會(huì)直接給出你想了解的答案;用機(jī)器幫助人類完成更便捷、更高質(zhì)量的對(duì)話。

AI突破新邊界王小川在香港亮出全球首個(gè)虛擬主播

  (圖4:RISE大會(huì)參會(huì)者)

此外,隨著人們跨國交流需求的增加,翻譯的需求將會(huì)激增。運(yùn)用領(lǐng)先的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù),加之以上億級(jí)雙語平行語料訓(xùn)練,搜狗目前已經(jīng)支持61種語言的互譯,憑借豐富的產(chǎn)品場景,翻譯技術(shù)已經(jīng)運(yùn)用在了輸入法和搜索產(chǎn)品中。結(jié)合用戶出國和學(xué)習(xí)工作的使用場景,搜狗在今年連續(xù)推出了搜狗旅行翻譯寶和搜狗錄音翻譯筆兩款智能硬件,進(jìn)一步推動(dòng)了AI翻譯技術(shù)的實(shí)用化。

提及搜狗AI的下一步,王小川說:“以語言為核心,一方面我們?cè)谀甑字斑€會(huì)再發(fā)布四款新的智能硬件;另一方面會(huì)把這種計(jì)算能力用到醫(yī)療、法律這些垂直的領(lǐng)域,使得機(jī)器在垂直領(lǐng)域會(huì)變得更加的聰明。”

關(guān)于AI整體技術(shù)發(fā)展和產(chǎn)業(yè)落地,王小川有著這樣的判斷:美國固有的優(yōu)勢(shì)在于頂尖的科研技術(shù),而中國的優(yōu)勢(shì)在于用戶規(guī)模和應(yīng)用領(lǐng)域。目前全球已實(shí)現(xiàn)知識(shí)共享的聯(lián)通,前沿的人工智能學(xué)術(shù)論文發(fā)布后,中國可以學(xué)習(xí)和借鑒前沿的學(xué)術(shù)成果,并把它轉(zhuǎn)化為生產(chǎn)力。所以在人工智能領(lǐng)域,中國有機(jī)會(huì)跟美國在應(yīng)用層面上齊頭并進(jìn)。同時(shí),應(yīng)用層面生態(tài)的進(jìn)化,可以反過來推動(dòng)整個(gè)系統(tǒng)的發(fā)展,最終實(shí)現(xiàn)良性循環(huán)。

“技術(shù)改變世界”正在成為現(xiàn)實(shí),搜狗不僅持續(xù)在技術(shù)領(lǐng)域開拓創(chuàng)新,更驅(qū)動(dòng)著技術(shù)的不斷落地化、打造消費(fèi)級(jí)產(chǎn)品,將“中國制造”轉(zhuǎn)變?yōu)?ldquo;中國智造”。相信在未來,搜狗可以持續(xù)“讓表達(dá)和獲取信息更簡單”,讓科技真正地惠及人們的生活。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-12
AI突破新邊界王小川在香港亮出全球首個(gè)虛擬主播
有著"科技界達(dá)沃斯"之稱的Web Summit團(tuán)隊(duì)來到香港,開啟了為期四天的RISE科技大會(huì)。

長按掃碼 閱讀全文