8月12日消息,今年2月OpenAI發(fā)布文生視頻模型Sora,其逼真而富有想象力的視頻生成能力給大家?guī)?a href="http://m.ygpos.cn/AI_1.html" target="_blank" class="keylink">AI震撼。Sora雖然能生成60s視頻,但是并未對(duì)外開放使用,被視頻業(yè)者戲稱為“期貨”。
國(guó)內(nèi)AI生視頻的產(chǎn)品研發(fā)腳步也加快了,7月快手團(tuán)隊(duì)的AI生視頻產(chǎn)品“可靈” 網(wǎng)頁(yè)端正式上線 , 8月字節(jié)跳動(dòng)旗下的“即夢(mèng)AI”網(wǎng)頁(yè)、App也開放使用。這兩款產(chǎn)品都能實(shí)現(xiàn)“文生視頻”和“圖生視頻”,都免費(fèi)開放給用戶使用,可謂是真正的“現(xiàn)貨”了。
作為國(guó)內(nèi)短視頻領(lǐng)域的兩家頭部企業(yè),他們推出的AI生視頻工具表現(xiàn)如何呢?我們小小試用比較了一下,大家可以看看兩者的效果,你更喜歡哪一款。
測(cè)試條件:
目前可靈可生成5s、10s視頻,但是文生視頻“高性能模式”下不支持生成10s視頻;
即夢(mèng)AI可生成3s、6s、9s、12s視頻。
因此,我們選擇了默認(rèn)設(shè)置下,可靈(5s)和即夢(mèng)AI(6s)圖生視頻和文生視頻生成的效果進(jìn)行比較。
一、圖生視頻
從動(dòng)物、風(fēng)景、人物圖片來測(cè)試比較。
第一個(gè)
使用一張含有“熊貓”的照片。
輸入提示詞要求:熊貓頭抬起來,看向我,露出笑容
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
可靈比較尷尬的是,沒分清楚圖片中大熊貓的頭(朝下)和尾(在上面),直接把大熊貓的屁股給弄成頭轉(zhuǎn)向“我們”了。
即夢(mèng)AI雖然分清楚了大熊貓頭尾,但是嚴(yán)重失真,出現(xiàn)了6條腿的熊貓,而且在扭動(dòng)身體時(shí),熊貓身體甚至感覺要斷掉了……
整體效果來看,除去頭1s的首位倒置,可靈生成的熊貓更逼真、運(yùn)動(dòng)效果更連貫。
這一局PK,站可靈(+1分)。
第二個(gè)
用一張含有上海東方明珠塔的風(fēng)景圖。
輸入提示詞要求:東方明珠塔從下往上依次亮起彩燈
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢(mèng)AI生成的視頻中,東方明珠塔的燈從上往下亮起,和我們要求的方向相反了,視頻補(bǔ)充了路面上車輛經(jīng)過的視覺效果;
可靈的亮燈效果更明顯,特別突出了東方明珠塔上2個(gè)圓球的燈光視覺效果,運(yùn)鏡上,我們選擇了隨機(jī)運(yùn)鏡,這個(gè)視頻里整個(gè)塔都搖動(dòng)了起來,感覺不太真實(shí)。
整體來看,即夢(mèng)AI生成的視頻更逼真一些。
這局PK站即夢(mèng)AI(+1分)。
第三
用一張含有人物的圖。
輸入提示詞要求:孩子翻動(dòng)手中的書,并露出微笑
再看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢(mèng)AI生成的視頻翻車比較明顯,首先是被翻的書像是憑空多出一本摞在了上面,另外,人物手部變形嚴(yán)重。
可靈翻書動(dòng)作完成更好一些,人物手部也有變形,不過好歹還能分清手指,不至于像即夢(mèng)AI那么嚴(yán)重。
這局PK站可靈(+2分)。
下面,在看看可靈和即夢(mèng)AI的文生視頻表現(xiàn)。
二、文生視頻
第一個(gè): 采用Sora經(jīng)典視頻的提示詞,讓可靈和即夢(mèng)AI各自生成視頻。
輸入提示詞:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢(mèng)AI生成的人物行走時(shí)腿部姿態(tài)比較別扭,周邊人物的處理更虛化,整體效果更偏動(dòng)漫視覺效果。
可靈生成的人物行走流暢,周邊出現(xiàn)的人物也更為真實(shí),整體效果更逼真一些。
這局PK站可靈(+3分)。
第二個(gè):
輸入提示詞文本:在桂林山水間,一位俠女乘坐竹筏前行,她穿著紅色的長(zhǎng)裙,手拿黑色的佩劍,注視著遠(yuǎn)方,陽(yáng)光灑在水面,波光粼粼,有白云從山頂飄過。
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
即夢(mèng)AI生成的視頻很好的理解了“桂林山水”這四個(gè)字背后的意思,視頻對(duì)喀斯特地貌特征呈現(xiàn)更好。缺憾是“黑色的佩劍”這個(gè)表現(xiàn)形式太夸張了,飄來飄去有點(diǎn)兒失真。
可靈生成的視頻“桂林山水”特征不明顯,不過竹筏滑動(dòng)的效果及水面波動(dòng)和產(chǎn)生的光影效果更好。
這局PK真是比較糾結(jié),看在“桂林山水”的面子上站即夢(mèng)AI(+2分)。
最后,總結(jié)一下,從上面5五局PK來看,可靈3局勝出比即夢(mèng)AI。
大家覺得哪個(gè)更好呢?
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 高速追尾卡車死亡率最高 為何“鉆卡”成為致命風(fēng)險(xiǎn)?
- AI全面賦能人車家全生態(tài) 小米澎湃OS 2正式發(fā)布
- 蜂巢科技與寶視達(dá)簽訂戰(zhàn)略合作,以智能眼鏡開拓眼鏡消費(fèi)新增量
- TechWeb微晚報(bào):張一鳴身家達(dá)3500億元成中國(guó)首富,iPhone 16在印尼遭禁售
- 小鵬汽車們憑什么能不講武德?周鴻祎與何小鵬激辯AI時(shí)代如何創(chuàng)新
- 消息稱華為Mate 70系列11月上市 部分零部件投產(chǎn)數(shù)量增50%
- 從上班族到月銷60萬店主 夢(mèng)餉科技助力普通人開辟職業(yè)發(fā)展新曲線
- 消息稱菜鳥全面接入京東第三方平臺(tái) 雙方已基本完成對(duì)接
- 靠“收割”司機(jī)扭虧為盈?貨拉拉四戰(zhàn)IPO,估值較去年縮水250億元
- 2024年Q3學(xué)習(xí)平板銷量同比增長(zhǎng)38% 作業(yè)幫學(xué)習(xí)機(jī)銷量增速均第一
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。