Midjourney、文心一格、WHEE等五款主流AI繪畫工具橫向測評報告

AI繪畫好奇又心動的你,是否也在面臨這樣一個疑惑:想要嘗試AI繪畫,卻不知從何選擇合適的平臺?

1.jpg

2024年初,隨著Sora橫空出世,人工智能再次以爆炸性的熱度進入了大眾的視野。只要有一顆好奇的心,似乎誰都想來體驗一下它的魔力。

然而,盡管Sora的表現(xiàn)令人印象深刻,但我們卻無法立即體驗。

不過,作為AI視頻的靜態(tài)替代品,AI繪畫有許多工具可以選擇,他們分別有什么各自的優(yōu)勢和特點呢?

在今天的文章里,@德里克文 公眾號會對國內(nèi)使用人數(shù)較多的幾款在線AI繪畫平臺進行橫向比較。他們分別是Midjourney, VEGA AI, ,WHEE,無界AI和文心一格。

其中Midjourney作為業(yè)界標桿,被廣大AI繪畫愛好者所熟知;而其余四款則是國內(nèi)目前大家可以開放注冊的國內(nèi)AI網(wǎng)站。

值得提醒的是,選擇這五個AI進行比對測評,純屬本人觀點,并以幫助新手了解不同平臺屬性為主。

2.jpg

在接下來的評測中,我將從功能特性與用戶體驗,畫面風格豐富性,價格與性價比,創(chuàng)新性和適用性等多個維度展開,幫助大家找到最適合自己的AI繪畫伙伴。

心動不如行動,讓我們一起踏上AI繪畫的探索之旅吧!

一、AI繪畫軟件簡介

1. Midjourney

官方簡介:Midjourney 是一個獨立的研究實驗室,致力于探索新的思維方式并擴展人類的想象力。它是一個人工智能繪圖平臺,專注于設計、人類基礎設施和人工智能。

3.jpg

Midjourney的具體應用場景包括但不限于B端設計(如中后臺業(yè)務中的圖標、數(shù)據(jù)大屏、登錄頁、官網(wǎng)插圖等)、拍攝素材(適用于業(yè)務側(cè)服務場景、新媒體應用、形象宣傳等),實物生成(如玩具),以及藝術(shù)創(chuàng)作、產(chǎn)品設計、廣告制作等領域。

4.jpg

我采用Midjourney生成圖片效果

Midjourney的應用場景廣泛,涵蓋了從B端設計到個人藝術(shù)創(chuàng)作等多個領域,同時,它通過多種渠道積極收集用戶反饋,不斷優(yōu)化產(chǎn)品和服務,以滿足用戶的需求。

2.Vega AI

官方簡介:Vega AI 是由右腦科技推出的AI繪畫工具,它是一款新興的在線創(chuàng)作工具,旨在簡化操作流程,提高內(nèi)容創(chuàng)作效率。

5.jpg

Vega AI是一款能夠文字生成圖片、條件生成圖片、風格訓練等功能的AI工具庫,幫助用戶通過在線方式快速生成圖片。它支持高達2K和4K的超高分辨率,以及上傳任意圖片的HD優(yōu)化功能。

6.jpg

我采用VEGA AI生成圖片效果

Vega AI能夠根據(jù)用戶的簡單草圖或輸入的關鍵詞,生成富有藝術(shù)感的圖像或設計,極大地降低了繪畫和設計的門檻,提高了創(chuàng)作效率和質(zhì)量。

3.WHEE

官方簡介:WHEE 是一款國產(chǎn)AI,由美圖公司自主研發(fā),專注于視覺和文字之間的橋梁構(gòu)建。WHEE軟件是美圖旗下的一款AI繪畫平臺,主要功能包括文生圖、圖生圖、創(chuàng)作詞庫、風格模型等。

用戶可以通過輸入提示詞或?qū)胝掌姆绞?,讓AI根據(jù)這些信息生成對應的圖像或多種風格的繪畫作品。此外,WHEE還提供了AI修圖功能,能夠滿足用戶在視覺創(chuàng)作方面的需求。

7.jpg

WHEE不僅會畫圖、生視頻更能修圖,各種修改圖功能一應俱全。使用門檻低,用戶只需用自然語言表述需求,就能輕松上手;通過自研AI視覺大模型MiracleVision,讓生圖更輕松、出圖更專業(yè)、改圖更準確。

APP中不僅能支持豐富的AI創(chuàng)作和改圖,出色的AI超清功能更能讓模糊的圖片轉(zhuǎn)變?yōu)榍逦J利的視覺盛宴。此外用戶還可以欣賞并學習來自多領域創(chuàng)作者的精美作品,為創(chuàng)作提供豐富的靈感來源,進而促進二創(chuàng)和設計師間的交流與合作。

8.jpg

我采用WHEE生成圖片效果

對于設計師來說,WHEE提供了一系列輔助創(chuàng)作功能,如線稿上色、涂鴉生圖等,幫助設計師實現(xiàn)創(chuàng)意表達。此外,WHEE的設計理念是簡化操作步驟,使用戶能夠輕松上手,無論是專業(yè)人士還是普通用戶都能享受到便捷的AI視覺創(chuàng)作服務

4.無界AI

官方簡介:無界AI是無界版圖推出的專注于AIGC(人工智能創(chuàng)作圖片、漫畫與視頻)的社區(qū)和平臺,專注于提供簡潔易用、模型豐富的 AIGC 繪畫工具。

9.jpg

它集成了 prompt 搜索、AI 圖庫、AI 創(chuàng)作等功能,并采用區(qū)塊鏈技術(shù)確保 AI 作品的版權(quán)保護。

10.jpg

我采用無界AI生成圖片效果

5.文心一格

官方簡介:文心一格是一款基于人工智能技術(shù)的繪畫產(chǎn)品,通過深度學習技術(shù),能夠根據(jù)用戶輸入的文字描述快速生成具有高度藝術(shù)感的繪畫作品。

11.jpg

它提供了豐富的插畫、人物、二次元、壁紙、頭像、風景、動物等素材圖庫,支持多種繪畫風格,包括油畫、水彩、素描、卡通、動漫等。

12.jpg

我采用文心一格生成圖片效果

二、橫向測評

本次測評我從我個人的角度進行評測,主要從面對大眾初學者的角度進行介紹,可能維度不夠全面,內(nèi)容不夠深入,包括用戶體驗和畫面感受可能帶有主觀性,但是我保證測評條目下內(nèi)容的客觀性。

我的邏輯是用戶快速入門體驗占15%,畫面完成效果占60%,擴展功能占25%。

有句話說的好,尺有所長寸有所短,每個平臺都有自己的優(yōu)勢特點和不足之處,我所做的是盡可能將我的測評情況展示給大家,請讀者根據(jù)實際效果,進行自我判斷,選擇符合自己AI繪畫平臺軟件。

13.jpg

以下涉及到圖面效果的部分,均為完全相同提示詞的測試(如碰到中英文提示詞軟件不兼容,采用同樣提示詞進行中英文轉(zhuǎn)換)。

1.用戶快速入門體驗

面對中國新手用戶的體驗我覺得是非常重要的點,而這也是一個比較主觀的部分。

對我來說,界面操作指引是否清晰,新手上手難度如何,提示詞對中英文的支持都是評測的維度標準。

先看下各自的操作生圖界面,我按照前文順序逐個介紹。

1)Midjourney alpha 網(wǎng)頁版

如果是新手的話,Midjourney 在國內(nèi)無法使用網(wǎng)站進行直接注冊登陸。

常規(guī)情況下,我們要通過使用Discord這個聊天軟件(需要國外IP)進行注冊,然后再Discord的聊天界面添加Midjourney的機器人,再采用聊天機器人喚起命令的方式使用,目前在Discord上沒有免費試用額度,需要付費使用。

不過當我們使用Discord超過1000張使用后,可以直接登陸網(wǎng)頁版使用。

14.jpg

Midjourney 網(wǎng)頁版比Discord要更加方便,界面指引清晰。

但是要生成一張完整高清的圖片,操作步驟相對比較繁瑣,以文生圖為例,需要經(jīng)過:【輸入框?qū)懱崾驹~——設置出圖參數(shù)——生成4張圖片——選擇其中一張圖片進行變化或高清生成】這幾個步驟,其中主要畫面輸入提示詞(Prompt)及操作界面均應為全英文。

15.jpg

對于新手來說,Midjourney 的使用還是有一定的上手門檻,尤其是對英文不好的朋友。

2)VEGA AI

相比較MidJourney, Vega AI登陸方式比較簡單,輸入網(wǎng)址后直接就可以登陸。

16.jpg

登陸后界面的指引是比較清晰易懂的,直接點擊相應板塊就可以生成。

通常初學者先采用文生圖,只需要點擊左側(cè)的“文生圖”進入到界面,在下方的輸入欄輸入提示詞,選擇一次性要生成的張數(shù),然后需要等待一小段時間排隊。

17.jpg

等排隊結(jié)束,就可以直接看到生成的圖片成果,小圖免費生成,如果需要加速或者高清放大,需要付費。

18.jpg

可以使用中文提示詞,也支持英文,可選擇的模型也不多簡單易懂,對于新手上手來說非常便捷。

3)WHEE

WHEE的登陸界面同樣非常便捷,同時還提供了電腦網(wǎng)頁版和移動手機端的不同選擇,非常方便。

19.jpg

登陸后界面指引清晰,包括直接進行創(chuàng)作的工具、社區(qū)免費分享的提示詞、操作教程都一覽無遺,對于新手用戶的指引是非常優(yōu)秀的。

對于新手來說,可以點擊具體的內(nèi)容例如“文生圖”也可以直接在輸入框輸入提示詞進行生成。

20.jpg

也可以直接往下拉,從社區(qū)分享里面找到他人分享的優(yōu)秀作品,點擊“創(chuàng)作同款”進行一鍵模仿。

21.jpg

這對于新手來說,真的很方便。直接在輸入界面輸入提示詞,隨后就直接可以生成效果不錯的圖片,不需要排隊等待。

而除了在頁面上點擊快捷創(chuàng)作,還可以進入“文生圖”界面,里面的快捷操作還可以選擇一次出圖的張數(shù),最多一次可以出4張,節(jié)約出圖等待時間。

22.jpg

提示詞同時支持中英文,模型只有一個整合的綜合大模型,對于新手來說可以不用煩惱選擇的為,直接生成就可以,無論是什么風格效果都不錯。

4)無界AI

無界AI也可以直接通過網(wǎng)站進行訪問,同時也提供了網(wǎng)頁和APP端的下載地址。

登錄后,需要注意的是首頁搜索欄并不是直接輸入提示詞可以生成,而是一個社區(qū)搜索,部分的分享提示詞免費,但是有一些是需要支付積分才能采用的。

界面?zhèn)€人感覺稍顯復雜,要找到直接進行文生圖的界面還需要在上方的小字中找到”AI創(chuàng)作“才能開始。

23.jpg

進入操作界面后,我覺得對于新手來說是有點復雜的,因為界面上有眾多的模型主題,標簽選擇等東西,讓選擇困難癥的人非常糾結(jié)。雖然給到很多專業(yè)的內(nèi)容,但是界面給人第一感覺是信息密度過高。

不過,其實你也可以不用管那些細節(jié),只需要輸入提示詞,直接點立即生成就行。

他的特點是生成還有普通模式和潮汐模式兩種,可以根據(jù)自己對圖片的緊急程度進行選擇,這個是一個很不錯的設定,畢竟生成需要積分,注冊有送免費積分,節(jié)約點用總是好的。

24.jpg

在提示詞輸入方面,無論中英文都可以用,很方便。

5)文心一格

文心一格同樣可以通過網(wǎng)站直接進入。

登錄界面我覺得也還不錯,右上角有一個立即創(chuàng)作,很方便就知道怎么進入。

25.jpg

進入后選擇界面指示也比較清晰,畫面類型有一個智能選擇,新手的話直接輸入提示詞,點擊立刻生成,就可以看到效果了。

從便捷性方面還是比較好上手的。

26.jpg

不過在對中英文的支持方面就比較遜色了,只支持中文,如果輸入了英文單詞,就無法繼續(xù)。

用戶體驗總體評分:

27.jpg

2.畫面完成效果

在畫面完成效果方面,我從初學者常碰到的場景需求入手,分析幾個主要的使用場景。

1)文生圖

文生圖是最基礎的需求,簡單來說就是通過輸入提示詞,在不進行其他參數(shù)設置的情況下,對比下各家的圖片生成效果。

我分別就用有代表性的人像、古詩風景、寵物這幾個場景進行效果測試。測試采用同樣的提示詞、比例尺寸、默認參數(shù)下的效果。

人像:

提示詞:一個美麗的中國女孩(A beautiful Chinese girl),畫面比例:9:16,參數(shù):均為基礎默認值

28.jpg

古詩風景:

提示詞:中國風,古詩,孤帆遠影碧空盡,唯見長江天際流,意境悠遠,禪意,大面積留白,國風寫意

(Chinese style, ancient poetry, ‘A solitary sail, its shadow vanishes into the boundless blue sky, only the Yangtze River flows to the horizon’, conveying a sense of vastness and serenity, Zen inspiration, extensive use of white space, traditional Chinese freehand brushwork.)

畫面比例:9:16,參數(shù):均為基礎默認值

29.jpg

寵物:

提示詞:一只可愛的貓咪 (A lovely cat),畫面比例:9:16,參數(shù):均為基礎默認值

30.jpg

附上部分測試過程截圖:

Midjourney

31.jpg

Vega AI

32.jpg

WHEE

33.jpg

無界AI

34.jpg

文心一格

35.jpg

本階段我的總體評分:

36.jpg

3.功能豐富程度

功能豐富程度這一項,我將各自產(chǎn)品的特點,對于入門者比較實用的部分進行大致的介紹。

1)圖像高清處理

圖像高清處理是一個非常實用的功能,用于老照片修復或者原照片的放大效果,Midjourney、Vega AI、WHEE、無界AI均支持對生成圖片上進行進一步的高清放大功能,文心一格我未發(fā)現(xiàn)可以直接對生成圖片進行直接放大的功能。

37.jpg

而對現(xiàn)有的圖片的高清放大功能,Vega AI、WHEE、文心一格均有畫質(zhì)提升功能,Midjourney和無界AI我沒有發(fā)現(xiàn)對其他圖片的高清放大功能。

38.jpg

39.jpg

40.jpg

而在對這幾個工具的高清功能測試中,最讓我感覺的驚艷的是WHEE,他的高清放大4倍功能,最大可達5120*5120,不僅細節(jié)還原度高,而且忠于原圖,老照片修復再也不用愁了。

41.jpg

2)風格多樣性和新手學習指引

模型的豐富程度會直接影響不同畫風的生成,提示詞借鑒可以讓新手更快學會如何上手。

在這個方面,讓我直接放上各家社區(qū)的優(yōu)秀分享圖片,均為默認情況,并且放上,大家感受下吧。

Midjourney

Midjourney社區(qū)的圖像分享風格較為多元,而且都是可以免費取得提示詞及所有參數(shù),對新手學習十分友好

42.jpg

Vega AI

Vega AI 的風格稍顯單一,可以免費獲取風格類型,但是無法獲取提示詞,對新手來說,沒有提示詞只有風格詞匯,借鑒意義不太大。

43.jpg

WHEE

WHEE社區(qū)分享的風格較好,各種風格都有而且質(zhì)量高,而且可以免費取得提示詞及所有參數(shù),對新手學習十分友好

44.jpg

無界AI

無界AI社區(qū)分享的風格多樣性一般,提示詞及參數(shù)的獲取需要看分享人的設置,有些是免費分享,有些是需要支付積分才能分享,對新手學習上手難度一般

45.jpg

文心一格

文心一格社區(qū)分享的風格多樣性較好,可以免費取得提示詞及所有參數(shù),對新手學習十分友好

46.jpg

3)特色功能意義及效果

在特色功能上,我說下各家讓我留下深刻印象的功能。

MidJourney

MidJourney的角色一致性讓我非常驚艷,效果好,控制力強大,讓實現(xiàn)使用同一個角色完成繪本或電影畫面,成為可能。

47.jpg

角色一致性效果

48.jpg

角色+畫風一致性效果

Vega AI

Vega AI的姿勢生圖讓我覺得很有特色,不過實測效果不太好,沒有達到控制要求。

49.jpg

WHEE

WHEE的畫面參考效果非常出眾,讓我非常的驚喜!無論是圖像、文字還是二維碼生成,操作簡便而且效果非常強大。

50.jpg

51.jpg

而WHEE還有一個獨有的畫面細節(jié)功能,能夠讓畫面的細節(jié)進行調(diào)節(jié),針對“AI感過重”或者“細節(jié)不足”的情況,將細節(jié)進行簡化或增加,讓畫面整體關系更加協(xié)調(diào)。

52.jpg

無界AI

無界AI的AI實驗室也有很有很有趣的內(nèi)容,熟悉使用Stable Diffusion的朋友就會知道。

53.jpg

我嘗試采用線條控制出圖,實際效果未能達到我想像的程度,不過也還算勉強能用。

54.jpg

文心一格

文心一格同樣也有藝術(shù)字功能,對于簡單的視覺生成效果也還成,但是達不到WHEE讓我驚艷的融合感受。

55.jpg

本階段我的總體評分:

56.jpg

三、綜合匯總評價

先看最終的總分匯總:

57.jpg

通過上面的分析,其實可以看出來,在目前在線的AI繪畫軟件中,表現(xiàn)最優(yōu)秀的是Midjourney和WHEE,這也是我使用的最多也最推薦的AI繪畫軟件。

在最關鍵的指標畫面完成效果方面, Midjourney和WHEE發(fā)揮穩(wěn)定而且質(zhì)量更高,Midjourney在畫面風格多樣性、電影畫面感方面更勝一籌,而WHEE在亞洲人臉,東方美學方面也有自己獨特的優(yōu)勢。

58.jpg

Midjourney的出圖效果

而在用戶體驗方案,對于國內(nèi)未接觸過AI的新手來說,Midjourney的入門門檻相對較高,便捷性較差,而在這一方面,國內(nèi)的幾個AI繪畫軟件都要更加容易上手,在本土化的語言方面也各自有優(yōu)勢。

59.jpg

WHEE的出圖效果

在功能豐富程度及效果方面,我們也可以看到WHEE在高清人像,獨有的畫面細節(jié),精確控制方面有獨到之處,效果俱佳。

60.jpg

這一份我認真做了許久的AI繪畫軟件橫向測評,希望給希望學習AI繪畫,探索這一新的藝術(shù)形式的小伙伴們一個幫助。(本文來源:公眾號“德里克文”)

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )