生產(chǎn)效率提升15倍,機(jī)器創(chuàng)意會取代人嗎?

生產(chǎn)效率提升15倍,機(jī)器創(chuàng)意會取代人嗎?

當(dāng)業(yè)界還在激烈探討創(chuàng)意總監(jiān)們是否會失業(yè)時,快速迭代的機(jī)器生產(chǎn)力已經(jīng)在悄然改變營銷創(chuàng)意的生產(chǎn)關(guān)系,并裹挾著廣告從業(yè)者們,從古典廣告時代向數(shù)字營銷時代一路狂奔。

來自巨量引擎的數(shù)據(jù)顯示,平臺上的創(chuàng)意素材,已經(jīng)有近50%來自機(jī)器創(chuàng)作,此外還有22%是人通過智能化的創(chuàng)意工具生產(chǎn)出來的。也就是說,機(jī)器對創(chuàng)意的滲透率已經(jīng)高達(dá)70%。而這個數(shù)字還在不斷被刷新。

這一切都源于信息流廣告的興起,尤其是抖音開啟的短視頻信息流廣告浪潮。瀑布流般的呈現(xiàn)形式,在帶給用戶極大豐富選擇的同時,也展示了對創(chuàng)意素材超乎尋常的胃口。

數(shù)據(jù)顯示:從2019年到2020年,全行業(yè)視頻廣告創(chuàng)意生命周期下降了50.63%,而同期有消耗的視頻廣告數(shù)量增長了4倍。

這也意味著,廣告主們最需要的,不僅是一條耗時數(shù)月精心打磨出來的優(yōu)秀創(chuàng)意,更是在1天內(nèi)就能產(chǎn)出的1000條優(yōu)秀創(chuàng)意。

如何才能規(guī)模化、高效的解決這個問題?

事實驗證:規(guī)?;枨笞詈玫慕鉀Q途徑還是技術(shù)。圖文信息流的媒體巨擘們找到了程序化創(chuàng)意(Programmatic Creative)。這種以機(jī)器算法與大數(shù)據(jù)洞察為核心,對廣告素材進(jìn)行分解與動態(tài)組合,從而達(dá)到規(guī)?;a(chǎn)的創(chuàng)意生產(chǎn)機(jī)制。

但當(dāng)廣告形態(tài)演化到短視頻時代,新的解決方案會是什么?巨量引擎的技術(shù)團(tuán)隊的選擇是:讓機(jī)器直接生產(chǎn)創(chuàng)意。

很多人認(rèn)為,創(chuàng)意這個事,是人類文明皇冠上的明珠,結(jié)合了心理學(xué)、美學(xué)、傳播學(xué)等多個學(xué)科,代碼真的能讓機(jī)器代替人腦搞創(chuàng)意嗎?

而創(chuàng)意技術(shù)團(tuán)隊用事實證明,技術(shù)讓創(chuàng)意生產(chǎn)進(jìn)入了一個新階段:以人工為核心的經(jīng)驗創(chuàng)意,走上了以機(jī)器為核心的智能創(chuàng)意演變之路。

2018年年初,當(dāng)時市面上幾乎所有的智能創(chuàng)意解決方案都是針對圖文廣告的。當(dāng)時頭部平臺巨量引擎的創(chuàng)意素材庫里的物料,90%左右都是圖文,只有10%左右是視頻。而迫切希望在短視頻平臺上投放廣告的廣告主們,有視頻創(chuàng)意生產(chǎn)能力只占少數(shù)。

面對問題,工程師們擅長的是把復(fù)雜的問題拆解成簡單的問題。巨量引擎創(chuàng)意技術(shù)團(tuán)隊把視頻創(chuàng)意需求問題拆解成了兩層:生產(chǎn)層和效果層,最迫切的是生產(chǎn)層。

生產(chǎn)層面對的兩個核心問題是:

1. 如何讓不會生產(chǎn)視頻的廣告主能夠生產(chǎn)視頻?

2. 如何讓視頻創(chuàng)意的生產(chǎn)速度跟上流量的消耗速度?

工程師們的解決思路同樣簡單:不會剪視頻,那就讓技術(shù)一鍵剪出視頻;生產(chǎn)速度跟不上流量消耗速度,那就借助算法模型和素材庫,利用已有的視頻,派生出更多的視頻。

在這個思路指導(dǎo)下,2019年9月,巨量引擎首款能夠自動生成創(chuàng)意視頻的工具上線。

用戶只需要上傳任意尺寸的圖片、視頻、文字、音樂等素材,機(jī)器就能迅速對素材進(jìn)行分解、遴選、裁剪、排序,2分鐘即能生成12支結(jié)合了不同特效、不同轉(zhuǎn)場風(fēng)格、不同音樂,且能自動卡點、自動配音、自動匹配字幕的創(chuàng)意視頻。用戶從中挑1支滿意的視頻即可。

而同樣的視頻,要由人工剪輯的話,需要經(jīng)過找音樂、標(biāo)記卡點、遴選高光鏡頭、高光片段混剪、視頻尺寸裁剪、編輯字幕、配音并校對時間、添加特效轉(zhuǎn)場等8個繁瑣的環(huán)節(jié),即便是最熟練的剪輯師,也需要30分鐘才能剪出1支。

這款產(chǎn)品就是引起行業(yè)極大反響的“微電影”。

“微電影”上線后,使用反饋雪花般飛來,追求極致的工程師們迅速進(jìn)行產(chǎn)品改進(jìn)。6個月后,經(jīng)過15次迭代的微電影Pro版上線,在原微電影基礎(chǔ)上,融合了視頻編輯器、模板視頻,可以滿足從小白到高手的高頻需求。

30分鐘vs2分鐘,15倍的效率提升背后,究竟是怎樣的魔法?

巨量引擎創(chuàng)意技術(shù)團(tuán)隊稱這項技術(shù)為“自動生成技術(shù)”。簡單的說,就是由機(jī)器通過模型算法,利用現(xiàn)有的素材,直接生成不同創(chuàng)意的技術(shù)。目前該技術(shù)已經(jīng)在創(chuàng)意生產(chǎn)上得到了廣泛應(yīng)用,比如能自動生成廣告標(biāo)題的妙筆、自動生成海報的圖靈等產(chǎn)品等等。

生產(chǎn)效率提升15倍,機(jī)器創(chuàng)意會取代人嗎?

讓機(jī)器生產(chǎn)創(chuàng)意素材,尤其是視頻素材,是個非常復(fù)雜的問題。

首先,機(jī)器得理解素材,其次,機(jī)器得理解剪輯,最后機(jī)器才能學(xué)會按人的思維剪出符合人類美學(xué)的視頻。

理解素材,就是機(jī)器得學(xué)會用人的視角明白視頻、圖像、文本、音樂講的是什么。

這涉及人工智能領(lǐng)域四大核心技術(shù)——自然語言處理、計算機(jī)視覺、語音識別合成以及機(jī)器學(xué)習(xí),每一項技術(shù)里又包含很多項子技術(shù)。比如計算機(jī)視覺就涉及目標(biāo)識別、圖像分割、人臉檢測、人臉識別、生成式對抗網(wǎng)絡(luò)等技術(shù),綜合下來要實現(xiàn)機(jī)器生產(chǎn)素材,至少需要幾十項AI前沿技術(shù)。

但這對巨量引擎創(chuàng)意技術(shù)團(tuán)隊而言,并不難。

畢竟,字節(jié)跳動在自然語言處理、計算機(jī)視覺、語音識別合成、機(jī)器學(xué)習(xí)等方面有著雄厚的技術(shù)積累,而且在今日頭條、西瓜視頻、抖音等十多款內(nèi)容平臺有著廣泛地落地應(yīng)用。

如何讓這些技術(shù)在對穩(wěn)定性要求更高的商業(yè)化場景的落地應(yīng)用?

創(chuàng)意工程師與AI工程師們一起,進(jìn)行了多模態(tài)內(nèi)容開發(fā),不斷調(diào)教機(jī)器,讓機(jī)器越來越準(zhǔn)確地識別各種素材,并將其應(yīng)用到各種商業(yè)化場景中。不斷的學(xué)習(xí)中,機(jī)器越來越理解商業(yè)素材的特性。

機(jī)器理解了素材后,就需要學(xué)習(xí)剪輯,即對多組視頻鏡頭進(jìn)行切割后重新排列,從而形成新的敘事邏輯,其中的關(guān)鍵能力是“敘事”。

人類敘事能力,是兒童時期通過不斷與父母溝通,觀察和感受父母的語言、表情等反饋逐漸習(xí)得的。同理,機(jī)器的“敘事”能力養(yǎng)成也需要靠海量數(shù)據(jù)的反饋。

生產(chǎn)效率提升15倍,機(jī)器創(chuàng)意會取代人嗎?

工程師們總結(jié)了大量人工視頻的剪輯手法,并引入專業(yè)人士,為機(jī)器制定了基本剪輯規(guī)則。比如在時間布局上,他們告訴機(jī)器,第n秒后用戶會產(chǎn)生視覺疲勞,因此需要一個動感的轉(zhuǎn)場,第M秒最好用舒緩的鏡頭過渡方式??臻g布局上,他們提供視覺最舒適的文字與圖像在畫幅中的分配方案,以及大致的色彩搭配等規(guī)則。

工程師們將這些規(guī)則系統(tǒng)化,結(jié)合數(shù)據(jù)洞察,并將其數(shù)據(jù)化、模型化,讓機(jī)器建立剪輯邏輯,嘗試將素材組合起來,并不斷利用最新的視覺技術(shù),提升機(jī)器剪輯能力。

例如將光感度各不相同的鏡頭進(jìn)行混剪,機(jī)器一開始沒有頭緒,但引入了光學(xué)鏡頭視覺重心分析技術(shù)后,就可以通過分析不同鏡頭中的視覺重心,進(jìn)行符合人類視覺習(xí)慣的排列,最終保證了用戶觀看到的畫面是流暢的。

生產(chǎn)效率提升15倍,機(jī)器創(chuàng)意會取代人嗎?

同時,一方面通過抖音等內(nèi)容平臺上的大量視頻,建立優(yōu)質(zhì)視頻的反饋數(shù)據(jù)庫,一方面通過投放的商業(yè)視頻,建立商業(yè)反饋數(shù)據(jù)庫。

機(jī)器生成的素材,會不斷通過反饋數(shù)據(jù)集進(jìn)行訓(xùn)練,逐漸習(xí)得敘事邏輯。

當(dāng)數(shù)據(jù)積累形成了一定規(guī)模。機(jī)器對商業(yè)化廣告領(lǐng)域的好“敘事”該有的樣子逐漸清晰起來。就如同兒童也意識到故事里突然出現(xiàn)狗會更精彩,在一則15秒的廣告中,怎樣的轉(zhuǎn)折點最抓人眼球,哪些元素的運用會最大程度令觀者注意力集中,機(jī)器開始有了自己的答案。

舉例而言,在一則視頻廣告里,前三秒是一個美女拿著產(chǎn)品由遠(yuǎn)及近入畫的視頻,中間五秒是一段產(chǎn)品特色展示和使用方式的特寫鏡頭展示,同時借助文案自動轉(zhuǎn)換語音的功能配上解說詞,最后兩秒是促銷動畫貼紙引導(dǎo)用戶點擊跳轉(zhuǎn)。

生產(chǎn)過程不再需要套用模版,也無需人工指導(dǎo),整個敘事邏輯全部由機(jī)器自主決定。

剪出符合人類邏輯的視頻,只是達(dá)到了創(chuàng)意工程師們的合格預(yù)期,但如何讓機(jī)器剪出令人賞心悅目的視頻呢?

這時就需要創(chuàng)意專家們介入了。于是,4A公司的頂尖創(chuàng)意人被邀請進(jìn)來,并幫助工程師們建立起美學(xué)評價體系。

基于這些規(guī)則,機(jī)器會自動生成大量的候選集,而創(chuàng)意專家則會對初輪內(nèi)容進(jìn)行各個維度的人工評分。依據(jù)評分,機(jī)器對美好內(nèi)容的認(rèn)知越加清晰,進(jìn)而學(xué)習(xí)模型得到一次又一次的優(yōu)化。

生產(chǎn)效率提升15倍,機(jī)器創(chuàng)意會取代人嗎?

“美”并非深不可測,通過解構(gòu)分析,美可以被歸納出視覺、聽覺、光感等多個維度下的普遍規(guī)律。但凡有規(guī)律的事物,理論上都可以被機(jī)器所學(xué)習(xí)。巨量引擎已逐漸構(gòu)建起光學(xué)模型、美學(xué)模型、音樂模型等八個細(xì)分模型。

人類與機(jī)器共同努力,以一種匠人精神,細(xì)致入微的打磨廣告內(nèi)容的方方面面。最終,讓自動化生產(chǎn)優(yōu)質(zhì)創(chuàng)意內(nèi)容成為現(xiàn)實。

從不及格到及格相對容易,從良好到優(yōu)秀的路則更困難。

既要遵循實用原則,真正理解營銷人員的痛點,難點,實現(xiàn)廣告投放的更高性價比,同時也不能拋棄人類對美好事物的終極向往,始終堅信“美”的正義。

在同一套評分體系里,微電影最初生成的視頻只有30多分,但最新版生成的視頻,已經(jīng)能達(dá)到90分的高分,相當(dāng)于一個普通創(chuàng)意設(shè)計師的水平。

生產(chǎn)效率提升15倍,機(jī)器創(chuàng)意會取代人嗎?

創(chuàng)意數(shù)量的提升,只是基礎(chǔ),要真正滿足廣告主的需求,還需要看結(jié)果——是否能夠影響用戶?簡單的說,是否能吸引用戶點擊廣告?

答案很簡單,就是利用推薦技術(shù)與數(shù)據(jù)分析,讓用戶看到更符合自己喜好的廣告。

這個思路在內(nèi)容消費領(lǐng)域的應(yīng)用比較成功的是巨量引擎。那么,廣告怎么滿足個性化需求呢?

個性化創(chuàng)意的核心是如何把對的創(chuàng)意匹配給對的人。也就是說,機(jī)器首先需要借助數(shù)據(jù)洞察技術(shù),充分理解目標(biāo)用戶的內(nèi)容喜好與商業(yè)需求,知道TA們會喜歡什么樣的創(chuàng)意形式,并據(jù)此派生出不同的能夠滿足不同用戶個性需求的創(chuàng)意。

其次,機(jī)器需要借助各種算法,如質(zhì)量排序模型、效果預(yù)估模型等,篩選出優(yōu)質(zhì)創(chuàng)意,對用戶進(jìn)行精準(zhǔn)投放,并定時監(jiān)控投放數(shù)據(jù),根據(jù)用戶反饋不斷調(diào)優(yōu),停止數(shù)據(jù)不好的創(chuàng)意,啟用新的創(chuàng)意,直到選出最優(yōu)秀的創(chuàng)意。

這樣,目標(biāo)用戶看到了更喜歡的創(chuàng)意,廣告主收獲了更好的投放效果。

巨量引擎的數(shù)據(jù)統(tǒng)計,相對于人工創(chuàng)意視頻,采用了自動生成技術(shù)與個性化創(chuàng)意技術(shù)的創(chuàng)意視頻,投放CVR平均提升了61%,CTR平均提升了25%。

如今,在巨量引擎平臺,機(jī)器創(chuàng)意的影子無處不在,視頻生成、海報生成、標(biāo)題生成、模板視頻、程序創(chuàng)意等等。

正如開篇所言,僅2020年,巨量引擎平臺上,機(jī)器創(chuàng)意的滲透率就已經(jīng)超過70%,未來呢?創(chuàng)意人會被機(jī)器徹底取代嗎?

機(jī)器的確在顛覆創(chuàng)意行業(yè),甚至在變革創(chuàng)意生產(chǎn)關(guān)系,但在巨量引擎自動生成技術(shù)的研發(fā)過程中,機(jī)器并不能顛覆人的創(chuàng)意,人的創(chuàng)造力依然是創(chuàng)意發(fā)展的核心動力。

馬歇爾·麥克盧漢在《理解媒介》一書中曾斷言:一切技術(shù)都是人的延伸,智能創(chuàng)意技術(shù)同樣,建立數(shù)據(jù)模型、美學(xué)規(guī)則的是人,創(chuàng)意金字塔頂尖的作品,依然屬于才華橫溢的創(chuàng)意人。

機(jī)器創(chuàng)意打碎的只是創(chuàng)意的繁瑣流程,解放的卻是創(chuàng)意人最寶貴的創(chuàng)造力。人機(jī)聯(lián)手,才是創(chuàng)意的星辰大海。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )