從一個(gè)“換臉”魔法開始,讓我們走近優(yōu)酷AI魔法學(xué)院

利用AI完成視頻換臉,曾經(jīng)在去年底引起過全球科技媒體的廣泛討論。時(shí)至如今,普通人是否能夠玩一下這個(gè)有點(diǎn)“科幻”味道的技術(shù)呢?

剛剛一條微博引起了辦公室的注意。情況是這樣的,正當(dāng)我春困秋乏地琢磨著工作,突然我一位身為居老師迷妹的同事尖叫了起來。整個(gè)讓全辦公室瞬間清爽的分貝,引發(fā)了我的好奇,原來她在看一條長(zhǎng)這樣的微博:

本著對(duì)AI換臉的關(guān)注,我在居老師粉絲們的熱烈討論背景音中,研究了一下這個(gè)優(yōu)酷提供的換臉玩法。發(fā)現(xiàn)值得一聊的技術(shù)因素還真是挺多。

我相信大家都會(huì)認(rèn)同這樣一個(gè)邏輯:當(dāng)你看到一個(gè)技術(shù)駕輕就熟的時(shí)候,背后其實(shí)有千萬個(gè)技術(shù)支撐著它。而從換臉這件事中,我們或許也有機(jī)會(huì)一窺優(yōu)酷這樣的視頻平臺(tái),是如何部署、研發(fā)和應(yīng)用AI技術(shù),打造用戶體驗(yàn)升級(jí)的。

看過《哈利波特》的小伙伴都知道,一個(gè)咒語背后,是一個(gè)巫師的法力,再背后是一個(gè)魔法學(xué)院的教育。而AI也是如此,我們看到了一個(gè)AI玩法,背后可能隱藏著整個(gè)技術(shù)實(shí)體和無數(shù)工程師、科學(xué)家的辛勤努力。優(yōu)酷的換臉魔法恰好可以看做這樣一個(gè)入口,讓我們可以窺視背后的那個(gè)視頻魔法王國。

當(dāng)然了,首先讓我們先從這個(gè)引發(fā)無數(shù)尖叫的“換臉跟居老師組CP”到底是怎么實(shí)現(xiàn)的說起。

咒語顯靈:想跟愛豆組CP,一秒就夠了

研究了一下我們發(fā)現(xiàn),視頻大換臉是優(yōu)酷為了今年雙11打造的一個(gè)互動(dòng)玩法。

進(jìn)入優(yōu)酷搜“換臉”關(guān)鍵詞,就會(huì)跳轉(zhuǎn)到這樣的畫面。

用戶只要輸入一張正面照,就可以輕松完成視頻換臉。把一段視頻中的主角換成自己,跟愛豆組CP,參與熱門綜藝,變身丞相罵王朗,都不是問題。

其中有一些選項(xiàng),簡(jiǎn)直對(duì)粉絲是大殺器啊。比如:

請(qǐng)迷妹們暫時(shí)收起口水,咱們先正經(jīng)起來,看看這個(gè)玩法為什么受歡迎,尤其是它的技術(shù)突破在哪里。

顯然,我們可以看到的是,相比純技術(shù)平臺(tái)的換臉服務(wù),優(yōu)酷提供了一項(xiàng)普通用戶不需要任何技術(shù)門檻就可以嘗鮮的換臉。也就是說,普通用戶心水了很久的把男/女主角換成自己的心愿終于達(dá)成,可以跟愛豆直接生成視頻CP,代入感極強(qiáng)。

值得注意的是,觀看優(yōu)酷生成的換臉視頻,很容易發(fā)現(xiàn)兩件事:

1. 效果精準(zhǔn)逼真,對(duì)人臉的捕捉和還原非常自然。不會(huì)出現(xiàn)五官僵硬,或者跳幀的情況。這是很多復(fù)雜的換臉程序做不到的。

2. 精準(zhǔn)的體驗(yàn)建立在簡(jiǎn)單的數(shù)據(jù)輸入基礎(chǔ)上。優(yōu)酷的換臉玩法,操作非常簡(jiǎn)單,只需要一張照片就可以完成換臉。要知道,正常的換臉程序是需要用戶上傳前后左右各種照片的,普通用戶甚至根本沒有那么多角度的照片。

要做到這些,其實(shí)并沒有那么容易,背后隱藏著優(yōu)酷在AI技術(shù)上的充沛積累。

魔杖中的秘密:換臉術(shù)背后的優(yōu)酷AI秘籍

神奇換臉術(shù)的背后,是一大堆技術(shù)難題等待解決,比如視頻是立體多角度的,那么用戶上傳的照片沒有這些角度怎么辦?比如每個(gè)人的五官和臉型都不同,如何保證替換精度?這些難關(guān)的攻破,隱含著優(yōu)酷整體上的AI技術(shù)高度。

比如我們可以從這幾個(gè)技術(shù)邏輯,看待換臉魔法背后,優(yōu)酷在AI領(lǐng)域的積累。

1. 海量數(shù)據(jù)訓(xùn)練,磨煉出的小數(shù)據(jù)學(xué)習(xí)能力。

大部分換臉系統(tǒng),都需要用戶上傳大量圖片,并對(duì)膚色、光線環(huán)境等有苛刻要求,優(yōu)酷可以用一張圖片完成換臉,秘訣在于背后海量的人臉數(shù)據(jù)學(xué)習(xí),已經(jīng)讓系統(tǒng)達(dá)成了通用人臉能力。而這直接體現(xiàn)出的,就是優(yōu)酷作為積累海量?jī)?nèi)容的視頻平臺(tái),在AI三要素中的數(shù)據(jù)積累上達(dá)成的高度。之前很熱門的優(yōu)酷吻戲鑒定師話題,側(cè)面折射出優(yōu)酷的訓(xùn)練數(shù)據(jù)量之龐大,以及對(duì)數(shù)據(jù)深度挖掘的意愿與能力,這些數(shù)據(jù)能力,正在轉(zhuǎn)化成優(yōu)酷的AI優(yōu)勢(shì)。

2. 面部動(dòng)作捕捉精準(zhǔn)算法。

換臉玩法當(dāng)中,優(yōu)酷的算法模型不只是對(duì)五官進(jìn)行標(biāo)注,而且對(duì)包括顴骨、下顎等36個(gè)標(biāo)注點(diǎn)進(jìn)行標(biāo)注。這意味算法模型在人臉識(shí)別、圖像分割、動(dòng)作捕捉等領(lǐng)域的精準(zhǔn)能力。AI是算法精度打天下,顯然優(yōu)酷在換臉上也展示了算法研發(fā)能力的優(yōu)勢(shì)。

3.相對(duì)高魯棒性的人臉融合。

換臉的一大問題,在于用戶上傳照片,可能在光源、顏色、光影等方面與原視頻不同,從而可能產(chǎn)生貼合度等問題。從優(yōu)酷的換臉效果看,其算法本身的魯棒系數(shù)較優(yōu),而這也是更多AI視頻應(yīng)用落地的先決條件。

看似簡(jiǎn)單的換臉背后,實(shí)際隱藏著優(yōu)酷在AI世界中的三張王牌。如果向更上一層看去,會(huì)發(fā)現(xiàn)AI技術(shù)正在帶給優(yōu)酷全方位的能力加持。對(duì)于AI能力的搞研發(fā)力與高應(yīng)用度,正在流媒體行業(yè)中等待發(fā)揮重要作用。

悄悄打開的魔法學(xué)院大門:AI正在成為文娛新引擎

從優(yōu)酷接連拋出的AI技術(shù)驚喜,我們已經(jīng)可以看出優(yōu)酷在AI技術(shù)上的追求。這些高水準(zhǔn)的AI技術(shù)能力,又與其他AI技術(shù)體系聯(lián)合在一起,構(gòu)成了今天我們?cè)谝曨l平臺(tái)追片時(shí),可能體驗(yàn)到的各種AI應(yīng)用。

以優(yōu)酷為例,我們可以看到AI可以迎接雙11,帶來換臉這種高流量玩法,也可以對(duì)用戶觀看視頻、平臺(tái)剪輯制作視頻產(chǎn)生影響。

人臉識(shí)別、背景識(shí)別、場(chǎng)景識(shí)別、用戶喜好模型分析,以及體態(tài)識(shí)別、動(dòng)作追蹤等等技術(shù),都是可以直接利用在視頻場(chǎng)景中的人工智能技術(shù)。這些AI魔法不斷從底層涌入優(yōu)酷的視頻交互世界,我們可以清晰看到兩件事正在發(fā)生:

首先,是基于人臉識(shí)別的明星臉數(shù)據(jù)標(biāo)記,正在讓用戶追劇變得越發(fā)輕松自在。

今天的視頻平臺(tái)用戶,在手機(jī)端利用碎片化時(shí)間追綜藝已經(jīng)形成了常態(tài)。于是就出現(xiàn)了想要單追某一明星,比如在綜藝、影視劇中只看自己愛豆出場(chǎng)畫面的情況。在AI的幫助下,優(yōu)酷可以利用AI后臺(tái)智能剪輯功能,生產(chǎn)出海量明星CUT、綜藝精彩片段、熱播影視劇集。于是用戶可以讓AI幫忙找出自己想看的愛豆,輕松實(shí)現(xiàn)智能化追片。

其次,AI還可以是平臺(tái)提高剪輯效率,以及內(nèi)容生產(chǎn)效率的助手。

面對(duì)龐大的內(nèi)容數(shù)據(jù)集群,剪輯和創(chuàng)作其實(shí)是相當(dāng)費(fèi)時(shí)費(fèi)力的一件事,比如在重大足球賽事上,想要剪輯進(jìn)球、射門、犯規(guī)等集錦,過去是需要龐大團(tuán)隊(duì)晝夜趕工的一件事,并且球迷還要等上數(shù)小時(shí)甚至一天才能看到。

而在今年世界杯上,優(yōu)酷AI技術(shù)通過網(wǎng)羅以往賽事數(shù)據(jù)建立資訊庫,把足球比賽中常用的射門、進(jìn)球、犯規(guī)、過人、精彩集錦等片段結(jié)構(gòu)化、標(biāo)簽化儲(chǔ)存為模板。當(dāng)賽事直播中出現(xiàn)匹配片段時(shí),即可迅速實(shí)現(xiàn)分析識(shí)別,截取直播流精彩片段,最快10秒通過機(jī)器生產(chǎn)創(chuàng)作更多有趣、多角度的視頻內(nèi)容,由優(yōu)酷全站推送給用戶,滿足用戶多樣性需求,也為內(nèi)容生產(chǎn)者提供更多資源與素材。在降低人工成本的同時(shí)極大地提升了內(nèi)容生產(chǎn)效率。

讓用戶更開心順暢地享受視頻內(nèi)容,平臺(tái)和創(chuàng)作者可以更簡(jiǎn)單生產(chǎn)優(yōu)質(zhì)內(nèi)容,AI的魔法正在優(yōu)酷平臺(tái)中蔓延開來,以技術(shù)達(dá)成視頻交互的體驗(yàn)優(yōu)化。

一座視頻平臺(tái)背后的魔法學(xué)院,正在一個(gè)個(gè)黑科技背后,悄然面向產(chǎn)業(yè)打開它的大門。未來我們會(huì)得到什么呢?整部戲跟居老師搭檔?讓明星到你家來玩?用上帝之眼看一場(chǎng)刺激的球賽?AI與視頻的魔法偶遇,今天才剛剛開始而已。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-10-31
從一個(gè)“換臉”魔法開始,讓我們走近優(yōu)酷AI魔法學(xué)院
利用AI完成視頻換臉,曾經(jīng)在去年底引起過全球科技媒體的廣泛討論。時(shí)至如今,普通人是否能夠玩一下這個(gè)有點(diǎn)“科幻”味道的技術(shù)呢?剛剛一條微博引起了辦公室的注意。

長(zhǎng)按掃碼 閱讀全文