次元壁的重塑:當(dāng)AI主播走進(jìn)央視演播廳

我們對(duì)AI與新聞產(chǎn)業(yè)的想象,大多還停留于那些在瞬間生成新聞的“寫作機(jī)器人記者”,至于那些在新聞節(jié)目里出現(xiàn)的主播,誰(shuí)也想象不到他們會(huì)與AI產(chǎn)生任何聯(lián)系。

但變化總比想象中更快來(lái)臨。

在今年“3·15”晚會(huì)開播前,搜狗與央視財(cái)經(jīng)頻道聯(lián)合推出的AI主播“姚小松”正式亮相,在央視對(duì)“3·15”晚會(huì)進(jìn)行預(yù)熱。

當(dāng)我們描述兩個(gè)很難交融的領(lǐng)域發(fā)生碰撞時(shí),我們常常會(huì)將其形容為“突破次元壁”。而像搜狗AI主播這樣,牽手國(guó)內(nèi)最權(quán)威電視媒體,融合了AI技術(shù)與新聞播報(bào)產(chǎn)業(yè),幾乎可以被稱作是對(duì)次元壁的“重塑”。

當(dāng)原本屬于人類的傳播空間被擊破又重塑,我們可以去探討這一項(xiàng)技術(shù)的落地,會(huì)對(duì)我們的世界造成怎樣的改變。

聚集三次方:從復(fù)制粘貼到生命構(gòu)建

其實(shí)我們對(duì)這股突破次元壁的“神秘力量”并不陌生,在去年,就已經(jīng)有很多建立在對(duì)抗生成網(wǎng)絡(luò)上的人臉生成技術(shù)。

例如華盛頓大學(xué)曾經(jīng)推出的AI奧巴馬,就是通過(guò)神經(jīng)網(wǎng)絡(luò)模型對(duì)大量奧巴馬的照片、視頻進(jìn)行訓(xùn)練,再如同“復(fù)制粘貼”一樣替換掉原有視頻中的聲音和人臉,生成惟妙惟肖的“假奧巴馬演講”。

但搜狗AI主播則與以往的人臉生成技術(shù)不同,投入應(yīng)用的AI主播,顯然不能是前臺(tái)讓“替身”錄好視頻,再進(jìn)行后期處理,而是直接用技術(shù)生成栩栩如生的AI主播。

從論文中的實(shí)驗(yàn)數(shù)據(jù)到直面用戶的央視主播,其中的差別無(wú)異于“復(fù)制粘貼”和“生命構(gòu)建”,在這一過(guò)程中,搜狗AI形成了三種聚集。

1、 多模態(tài)模型的打造

和實(shí)驗(yàn)室中用幾百個(gè)小時(shí)打磨一張人臉的替換技術(shù)不同,AI主播想要投入使用,需要的是同一套模型通用無(wú)數(shù)人的能力,并且包含表情、嘴型、聲音和手勢(shì)多個(gè)維度。搜狗AI憑借著多模態(tài)識(shí)別能力,將語(yǔ)音、面部動(dòng)作識(shí)別、唇語(yǔ)識(shí)別等技術(shù)進(jìn)行了融合。在大量數(shù)據(jù)訓(xùn)練的基礎(chǔ)上,再結(jié)合圖像生成和語(yǔ)音合成技術(shù),才完成了動(dòng)作逼真、聲動(dòng)同步的AI主播能力塑造。

2、 快速投入使用的精準(zhǔn)能力

而AI主播融入產(chǎn)業(yè),尤其是和央視這種權(quán)威電視媒體的合作,給技術(shù)帶來(lái)了更嚴(yán)格的要求。一方面要求AI主播可以快速投入使用,編輯輸入文字后無(wú)需后續(xù)編輯就能及時(shí)播報(bào),同時(shí)新聞播報(bào)的容錯(cuò)率幾乎等于零,這是對(duì)搜狗技術(shù)能力極為嚴(yán)苛的考驗(yàn)。搜狗AI主播除了能夠生成聲音和形象以外,還通過(guò)語(yǔ)義理解能力為不同內(nèi)容搭配上不同的語(yǔ)調(diào)和表情,從細(xì)微處滿足應(yīng)用要求。

3、 深層交互的細(xì)節(jié)賽點(diǎn)

AI主播投入使用后,人們過(guò)了一開始的新鮮期,閾值只會(huì)不斷提升,為AI主播的真實(shí)度提出更多要求。這時(shí)需要搜狗AI繼續(xù)在微表情、微動(dòng)作上不斷提升,擁有技術(shù)的持續(xù)發(fā)展能力。搜狗語(yǔ)音交互技術(shù)中心高級(jí)總監(jiān)陳偉曾經(jīng)表示過(guò),搜狗AI主播的技術(shù)能力還在不斷完善,今年內(nèi)將在交互能力、2D+3D圖像融合等能力上進(jìn)一步提升。

權(quán)威電視媒體的技術(shù)迭新:即將劇變的新聞產(chǎn)業(yè)

除去技術(shù)以外,搜狗AI主播和央視的合作對(duì)于新聞界來(lái)說(shuō)也意義非凡。

自從社交媒體帶動(dòng)了自媒體的崛起后,新聞的界限就開始逐漸模糊,發(fā)聲權(quán)力不斷下放。到了如今AI驅(qū)動(dòng)的資訊推薦平臺(tái)興起,更是讓傳媒場(chǎng)中喧鬧紛擾。

我們能看到,從去年以來(lái)有大量資訊推薦平臺(tái)遭到了點(diǎn)名批評(píng)甚至關(guān)停,這意味著豐富的信息源已經(jīng)讓傳播趨于無(wú)序混亂,這種狀況亟待改變。

形成這種情況的一個(gè)重要原因就是,組織化的權(quán)威電視媒體,出產(chǎn)能力上就落了弱勢(shì)。一家權(quán)威電視媒體發(fā)布一條消息,可能立刻就會(huì)有一百位kol做出不同角度的解讀。不僅僅主流媒體自身設(shè)施議程的能力變?nèi)?,很難讓信息精準(zhǔn)傳播到受眾耳中,在大眾廣泛參與時(shí),沉默螺旋效應(yīng)也會(huì)變本加厲,“十萬(wàn)+”爆款、熱門評(píng)論、熱搜……這一切以流量基礎(chǔ)決定曝光度的機(jī)制很容易僅僅放大輿論場(chǎng)中的一種聲響,讓人們失去理性思考的能力。

這次央視和搜狗AI主播的合作,意味著權(quán)威電視媒體正在利用技術(shù)提升內(nèi)容出產(chǎn)效率,幫助權(quán)威信息更快速地傳播。

傳統(tǒng)的電視媒體要經(jīng)過(guò)文本采編、錄制、后期然后再進(jìn)行播放,不僅容易讓信息滯后,出產(chǎn)效率也相對(duì)較低。但AI主播的出現(xiàn),可以直接取消掉中間流程,直接讓文本信息變?yōu)橐曨l內(nèi)容,甚至多線協(xié)作,在瞬間推出無(wú)數(shù)條視頻新聞。讓權(quán)威消息更廣泛、高效地觸達(dá)用戶,對(duì)輿論場(chǎng)的走向形成正向引導(dǎo)。

如此看來(lái),央視和搜狗AI主播的合作可以說(shuō)是以技術(shù)效率追趕發(fā)聲權(quán)的典型案例了。今年中共中央政治局第十二次集體學(xué)習(xí)時(shí)重點(diǎn)提出的媒體融合,也提出了利用技術(shù)對(duì)傳媒形式進(jìn)行升級(jí)。這意味著會(huì)有更多傳統(tǒng)媒體和央視與搜狗AI主播的合作一樣,利用技術(shù)進(jìn)行自我迭新。此刻,我們正在迎來(lái)傳媒產(chǎn)業(yè)技術(shù)升級(jí)的奇點(diǎn)。

重新排列組合:AI合成的X未來(lái)

次元壁的重塑,引起的從來(lái)都不是一處力場(chǎng)的波動(dòng)。搜狗AI主播和央視的合作只是一個(gè)開始,展示了對(duì)真人模擬的案例。這一案例所打開的想象空間,才是更值得期待的。

AI主播并不僅僅只是停留在“主播”這一個(gè)工作身份上。在一切以語(yǔ)言為主要?jiǎng)谧鞣绞降墓ぷ魃矸葜?,主播可以說(shuō)是一個(gè)代表。這一技術(shù)的內(nèi)核,是利用AI綜合交互打造具備廣泛適應(yīng)性、能夠復(fù)制入各行各業(yè)的虛擬AI形象。通過(guò)對(duì)聲音、神態(tài)、語(yǔ)調(diào)甚至動(dòng)作的模仿,將作為內(nèi)容傳播者、發(fā)聲者的人類從中解放出來(lái),極大程度地提升效率。

例如在未來(lái)教育領(lǐng)域,教師的形象也可以通過(guò)AI被復(fù)制?,F(xiàn)如今的教育模式是一位老師為幾十位學(xué)生講解課程,而通過(guò)AI帶來(lái)的分身能力,未來(lái)可以實(shí)現(xiàn)讓每位學(xué)生在前端獲得屬于自己的AI老師,加之后端對(duì)教育內(nèi)容的快速加工生成,就能實(shí)現(xiàn)真正千人千面的個(gè)性化教育。

而在娛樂(lè)應(yīng)用上,虛擬AI形象能發(fā)揮出的作用更大。不僅能夠應(yīng)用在影視特效上,也能幫助娛樂(lè)產(chǎn)業(yè)快速出產(chǎn)內(nèi)容?;蛟S未來(lái)的偶像產(chǎn)業(yè),將完全建立在技術(shù)體系上,通過(guò)對(duì)真人形象的采集,讓每個(gè)粉絲可以擁有自己的偶像形象,輸入音頻文件就能生成MV。

這樣的能力還可以在無(wú)數(shù)領(lǐng)域創(chuàng)造驚喜,也許未來(lái)我們可以擁有真人形象的家庭AI助手,游戲中的角色會(huì)以真人形象展示,出現(xiàn)在銀行窗口的會(huì)是和真人一樣的“AI職員”。

AI越來(lái)越多地出現(xiàn)在我們的生活中,而搜狗擁有的能量,是將這些虛擬的“靈魂”融入到一具具肉體之中?;蛟S在未來(lái),為AI加以真人形象將成為一種剛需。而這時(shí)搜狗的提前布局,就會(huì)極大地發(fā)揮出作用,為這個(gè)次元不斷重塑的世界,再帶來(lái)一個(gè)無(wú)限可能性的X。

在如今這個(gè)技術(shù)不斷帶來(lái)新驚喜的時(shí)代,一次次元壁的重塑就如同一次世界規(guī)則的重新排列,無(wú)數(shù)變化蘊(yùn)生其中。有變化,便有新的期待。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-03-17
次元壁的重塑:當(dāng)AI主播走進(jìn)央視演播廳
像搜狗AI主播這樣,牽手國(guó)內(nèi)最權(quán)威電視媒體,融合了AI技術(shù)與新聞播報(bào)產(chǎn)業(yè),幾乎可以被稱作是對(duì)次元壁的“重塑”。

長(zhǎng)按掃碼 閱讀全文