擁抱短視頻,可能是最近自媒體圈中最為流行的關(guān)鍵詞。
單是微信視頻號的灰度測試,就讓媒體圈重度地震,原本隱藏在文字背后的“中年大叔”們勇敢出鏡,試圖抓住新生的機(jī)會窗口。和媒體朋友們?nèi)粘A奶斓脑掝},也不自覺地拐向了短視頻,有人購置了專業(yè)的影像設(shè)備,有人連忙招聘熟悉視頻剪輯的助理……
于是當(dāng)百度研究院推出AI合成短視頻平臺VidPress的消息傳出后,媒體圈里再次炸開了鍋,排著隊通過百度創(chuàng)作大腦進(jìn)行測試申請,爭先將自己剛剛寫就的深度文轉(zhuǎn)化為有聲有色的短視頻。畢竟VidPress的“果子”不可謂不誘人,只要輸入一個圖文內(nèi)容的鏈接,就能自動生成相應(yīng)的視頻內(nèi)容,極大地節(jié)約了成本和心力。
一番嘗鮮后,有人給了VidPress高分評價,也有人對效果的不滿意而詬病。鑒于兩種或贊或罵的態(tài)度,這里分享一下個人對VidPress的思考,到底是理想又一次敗給了現(xiàn)實,還是一開始就期許過高?
01 智能化內(nèi)容生產(chǎn)的原理
VidPress詮釋的視頻生產(chǎn)方式,足以用“智能”一詞來形容。
用戶輸入圖文內(nèi)容的鏈接后,VidPress將在9分鐘的時間內(nèi)完成視頻素材的聚合、解說詞生成、語音合成、音視頻對齊和渲染導(dǎo)出等一連串的“騷操作”,平均每天可以生產(chǎn)500到1000條視頻,妥妥秒殺了整條街的“剪刀手”。
這樣的內(nèi)容生產(chǎn)方式夸張嗎?不妨先來看看“黑魔法”背后的技術(shù)原理。
整個內(nèi)容生產(chǎn)過程可以分為三個環(huán)節(jié):
第一個環(huán)節(jié)是音頻內(nèi)容的生成,平臺基于多種語言模型對圖文內(nèi)容的文字部分進(jìn)行處理,然后自動生成一篇字?jǐn)?shù)符合要求且適合視頻呈現(xiàn)的解說詞,再通過文字轉(zhuǎn)音頻服務(wù)(TTS)合成解說詞語音;
同步進(jìn)行的環(huán)節(jié)是視頻內(nèi)容的生成,平臺會對圖文內(nèi)容進(jìn)行語義理解,根據(jù)文章內(nèi)容自動搜索相關(guān)素材,再通過計算機(jī)視覺技術(shù)對素材進(jìn)行分析和理解,然后精選出合適的素材進(jìn)行智能剪輯合成;
最后一個環(huán)節(jié)是音視頻的對齊,這就涉及到百度的第二代時間軸對齊算法,選取文本中的興趣點,再將視頻片段與興趣點的相關(guān)度進(jìn)行打分,優(yōu)質(zhì)的視頻片段將優(yōu)先放入時間軸,最終進(jìn)行渲染輸出。
對于熟悉百度技術(shù)體系或產(chǎn)品體系的朋友來說,恐怕不會驚訝VidPress的存在邏輯。單是百度大腦已經(jīng)對外開放的技能中,諸如自然語言理解、語音合成、計算機(jī)視覺相關(guān)的技能就占了不小的比重。聚焦到產(chǎn)品上,小度智能音箱的語音問答、動態(tài)播報、人臉識別等等,都不難在VidPress找到相似的技術(shù)。
只是短視頻內(nèi)容的生產(chǎn)從來都不是純粹的技術(shù)工作,素材、創(chuàng)意、選題等都影響著最后的視頻質(zhì)量。VidPress的價值在于利用算法和模型降低了素材搜集、整理、匹配、剪輯的時間成本,與當(dāng)下大多數(shù)落地應(yīng)用的人工智能產(chǎn)品相似,尚未實現(xiàn)取代人工甚至完勝人工的智能化程度。
也就是說,現(xiàn)階段的VidPress還只是輔助人工合成視頻,降低了短視頻剪輯的門檻和成本,本質(zhì)上是為內(nèi)容生產(chǎn)提供了新的思路。
02 視頻合成中的制約因素
有些遺憾的是,不少媒體朋友看到新聞后對VidPress進(jìn)行了測試,然后出現(xiàn)了一些負(fù)面的過度解讀。
為什么會出現(xiàn)視頻合成效果不盡如意的現(xiàn)象?還是要回到視頻內(nèi)容生成的環(huán)節(jié)。就技術(shù)層面來說,素材的智能識別、匹配、剪輯等過程已經(jīng)沒有太大的技術(shù)瓶頸,問題恰恰出在了內(nèi)容素材的廣度上。
畢竟現(xiàn)階段的人工智能遠(yuǎn)未達(dá)到自主生產(chǎn)視頻內(nèi)容的程度,VidPress也需要對網(wǎng)上的內(nèi)容進(jìn)行搜索匹配,扮演了內(nèi)容“搬運工”的角色。對應(yīng)的一幕就是:在科技、娛樂、軍事等內(nèi)容素材豐富的領(lǐng)域,VidPress的表現(xiàn)不乏可圈可點之處,也不難看到一些精彩的視頻案例;在一些新聞素材比較少的冷門領(lǐng)域,合成視頻的效果也就打了折扣。
舉兩個通俗易懂的例子。
倘若你上傳的是娛樂圈和某明星相關(guān)的內(nèi)容,不難在網(wǎng)上搜羅出豐富的素材,畢竟可以找到海量的電影、電視劇、綜藝等資源,VidPress可以在人臉識別算法、時間軸對齊算法的基礎(chǔ)上,對素材內(nèi)容進(jìn)行精準(zhǔn)識別、匹配、合成,內(nèi)容豐富度和流暢度上恐怕不輸于專業(yè)的視頻剪輯團(tuán)隊。
如果圖文內(nèi)容屬于情感、公益、社會相關(guān)的冷門內(nèi)容,話題本身就比較寬泛,其中還有較大比重的敏感內(nèi)容,可以使用的內(nèi)容素材也就相對有限,導(dǎo)致平臺可以聚合的內(nèi)容素材數(shù)量偏低,即便技術(shù)和算法進(jìn)一步優(yōu)化,也難逃“巧婦難為無米之炊”的困境。
歸根結(jié)底,內(nèi)容素材的豐富度才是VidPress場景應(yīng)用時的制約因素。
同時需要思考的恰恰是我們對內(nèi)容生產(chǎn)的態(tài)度,VidPress的基本價值在于工具,提供了一種有別于傳統(tǒng)人工的視頻合成思路,降低了視頻內(nèi)容生產(chǎn)的難度值??蓪τ诿襟w人來說,仍然需要躬身打磨內(nèi)容輸出有價值的觀點,繼而利用VidPress實現(xiàn)價值的最大化,畢竟視頻只是傳播的載體,優(yōu)質(zhì)內(nèi)容永遠(yuǎn)是話語權(quán)的關(guān)鍵。
或許對VidPress也是一種啟示,經(jīng)過了前期的試錯后,還需要對產(chǎn)品的定位進(jìn)行調(diào)整,比如在定制化與垂直品類上增加力度,在適用場景上進(jìn)行選擇,盡可能避開小眾內(nèi)容在素材上的限制,打造通用的解決方案。
03 未來可能的產(chǎn)品方向
站在百度的立場上,在短視頻的風(fēng)口期推出AI合成短視頻平臺,恐怕不是為了秀技術(shù)吸引眼球。
從圖文到短視頻再到直播,內(nèi)容的傳播方式越來越多元化,但在傳播載體不斷進(jìn)化的時候,內(nèi)容的生產(chǎn)方式似乎有些陳舊。從博客時代到公眾號時代,從長視頻時代到短視頻時代,內(nèi)容的表達(dá)越來越個性化,可內(nèi)容生產(chǎn)一直是“笨拙”的人工。
內(nèi)容傳播載體的進(jìn)化制造了一個又一個風(fēng)口,當(dāng)內(nèi)容創(chuàng)作方式同步進(jìn)化時,卻可能改變一個時代,所能創(chuàng)造的想象空間同樣不可小覷。截止到目前,VidPress還處于小批量免費試用的階段,與百度內(nèi)部人士進(jìn)行溝通后發(fā)現(xiàn),等待VidPress可能會有工具和平臺兩種產(chǎn)品方向。
從工具的方向來看,VidPress大概率會以SaaS服務(wù)的形態(tài)存在,可以在百度智能云上部署運營,也可以進(jìn)行私有化部署。前一種可以服務(wù)大部分內(nèi)容創(chuàng)作者,提供視頻快速剪輯合成的線上工具,并且可以與內(nèi)容版權(quán)方進(jìn)行跨界合作,為創(chuàng)作者提供一站式的視頻內(nèi)容生產(chǎn)服務(wù);后一種則是將能力賦予專業(yè)化的內(nèi)容團(tuán)隊,以人工智能的技術(shù)優(yōu)勢幫助創(chuàng)作團(tuán)隊提升效率、降低成本。
從平臺的方向上看,VidPress將在現(xiàn)有工具屬性的基礎(chǔ)上,與百家號、好看視頻、百度聯(lián)盟等內(nèi)容生態(tài)打通,形成視頻內(nèi)容生產(chǎn)、分發(fā)、變現(xiàn)的完整產(chǎn)業(yè)鏈。只是生態(tài)化布局的前提是解決內(nèi)容版權(quán)的局限,當(dāng)前VidPress還僅是邀請測試,并不涉及商業(yè)用途,正式開放后就需要百度提供免費的版權(quán)視頻庫,與一些第三方視頻版權(quán)庫合作,并設(shè)計出一套按需付費的商業(yè)模式。
當(dāng)然,上述的種種可能只是猜測,最終的產(chǎn)品演化方向還要靠百度的產(chǎn)品經(jīng)理們給出回答。但這樣的產(chǎn)品出現(xiàn),對媒體的影響要遠(yuǎn)大于某個內(nèi)容平臺的崛起,我們不僅要思考下一波流量在哪里,還需要深入思索自身的核心競爭力在哪里,如何與人工智能進(jìn)行分工協(xié)同,在未來的內(nèi)容生態(tài)中準(zhǔn)確找到自身的定位。
幾乎可以篤定,傳統(tǒng)純消耗腦力和時間的內(nèi)容生產(chǎn)終將被被顛覆,卻也是VidPress的第二代或者第三代產(chǎn)品的使命,現(xiàn)階段還有些“稚嫩”。
04 寫在最后
相較于被下一個風(fēng)口拋棄的焦慮,不妨多花點時間思考內(nèi)容消費的內(nèi)在邏輯:當(dāng)一個熱點出現(xiàn)時,需要多維度的觀察的報道,需要讓受眾客觀的了解事件的始末,也就需要多種不同的聲音。輸出有價值的信息,可以說是內(nèi)容創(chuàng)作最基本的競爭力,剩下的無非是基于成本、效率和用戶口味的權(quán)衡。
VidPress試圖呈現(xiàn)的正是降低“發(fā)聲”的門檻,推動互聯(lián)網(wǎng)內(nèi)容的多樣性。只是現(xiàn)階段還要先延遲一些期待,靜待VidPress后續(xù)的能力輸出。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 蘋果開啟年終大促,降價1200元,被國產(chǎn)手機(jī)嚇怕了?
- 長三角,如何把數(shù)據(jù)要素變成新長江?
- 大模型,在內(nèi)卷中尋找出口
- 比亞迪“天神之眼”重磅升級:無圖城市領(lǐng)航功能全國開通
- 不愿成為微信的支付寶,注定失敗
- 大廠年終獎全靠猜?京東帶頭透明化
- MediaTek 發(fā)布天璣 8400 移動芯片,開啟高階智能手機(jī)全大核計算時代
- 榮耀攜手“哪吒”鬧新春,2025魔法科技年貨節(jié)同步開啟
- 榮耀Magic7系列全面升級大王影像,AI超級長焦讓百倍望遠(yuǎn)也清晰
- 2024中國互聯(lián)網(wǎng)哈哈榜之2: 十大事件
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。