美圖自研視覺大模型3.0發(fā)布,全面應(yīng)用于旗下產(chǎn)品

10月9日消息,10月9日,美圖公司舉辦15周年生日會并發(fā)布自研AI視覺大模型MiracleVision(奇想智能)3.0版本。面世100天后,美圖AI視覺大模型MiracleVision3.0將全面應(yīng)用于美圖旗下影像與設(shè)計產(chǎn)品,并將助力電商、廣告、游戲、動漫、影視五大行業(yè)。

美圖視覺大模型的100天進(jìn)化:奇思妙想與智能創(chuàng)作

在美圖公司15周年生日會現(xiàn)場,美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻發(fā)布了自研AI視覺大模型MiracleVision3.0版本。

美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻

吳欣鴻介紹說,三個月前,MiracleVision繪畫水平還停留在初級階段,如今3.0版本已經(jīng)能描繪出真實細(xì)膩的畫面細(xì)節(jié),目前用戶可以訪問AI視覺創(chuàng)作工具“WHEE”官網(wǎng)體驗。

吳欣鴻將自己15歲的繪畫作品與面世100天的美圖視覺大模型生成作品進(jìn)行對比,他認(rèn)為訓(xùn)練AI與人類學(xué)畫有很多共通之處,通過充分學(xué)習(xí)不同的繪畫風(fēng)格和技巧,AI能創(chuàng)作出具有獨特性的原創(chuàng)作品。

美圖公司將自研AI視覺大模型MiracleVision(奇想智能)的核心能力拆解為“奇思妙想”和“智能創(chuàng)作”兩大特性。

在“奇思妙想”層面,MiracleVision通過“提示詞智能聯(lián)想”功能降低大眾的使用門檻,當(dāng)用戶輸入關(guān)鍵詞,MiracleVision可自動補充相關(guān)表述,如光影效果、質(zhì)感、風(fēng)格、圖片質(zhì)量等,推動創(chuàng)作平權(quán)。

此外,MiracleVision通過“提示詞精準(zhǔn)控制”功能來滿足更加專業(yè)的設(shè)計要求,如使用“近景”、“遠(yuǎn)景”、“順光”、“逆光”等描述控制最終生成效果。

在“智能創(chuàng)作”層面,MiracleVision通過“深化創(chuàng)作”功能,可以進(jìn)一步豐富作品細(xì)節(jié)和提升表現(xiàn)力。通過“AI畫面擴展”功能讓作品尺寸更大、細(xì)節(jié)更豐富。通過“局部修改”功能,對部分畫面進(jìn)行精準(zhǔn)修改與調(diào)整。通過“分辨率提升”功能生成高清大圖,讓細(xì)節(jié)表現(xiàn)、色彩展示、物體辨識更加的精準(zhǔn)和生動。

助力電商、廣告、游戲、動漫、影視五大行業(yè)

在吳欣鴻看來,AI視覺大模型帶來的不僅僅是更好的視覺呈現(xiàn),還有對工作流的效率提升,但目前大模型與工作流的結(jié)合仍在探索階段,抓住應(yīng)用場景的核心需求更為重要。

吳欣鴻介紹說,MiracleVision將落地電商、廣告、游戲、動漫、影視五大行業(yè),希望能幫助五大行業(yè)“工作流提效”。

在電商行業(yè),從涂鴉生成線稿、線稿上色、商品圖、模特試穿圖,再到電商物料輸出,全程可通過MiracleVision實現(xiàn)。

在廣告行業(yè),MiracleVision覆蓋創(chuàng)意腦暴、創(chuàng)意深化、平面排版、多尺寸延展、線下投放預(yù)覽的全工作流,助力客戶在廣告物料制作環(huán)節(jié)提效。

在游戲行業(yè),MiracleVision可以包攬場景設(shè)計、角色設(shè)計、道具設(shè)計、UI圖標(biāo)、宣發(fā)物料等流程,拓寬設(shè)計師想象空間的同時助力游戲行業(yè)降本。

在動漫行業(yè),MiracleVision打通了概念設(shè)計、故事板生成、線稿上色、動漫補幀、視頻轉(zhuǎn)動漫等流程,支持創(chuàng)意到物料成品的快速落地。

在影視行業(yè),MiracleVision的高可控性可充分滿足概念場景設(shè)計、分鏡設(shè)計、人物造型、道具設(shè)計、宣發(fā)物料的效果要求,極大提升影視行業(yè)設(shè)計環(huán)節(jié)的效率。

吳欣鴻表示,MiracleVision將充分發(fā)揮奇思妙想、智能創(chuàng)作的能力,在上述五大行業(yè)深耕,持續(xù)助力更多的設(shè)計場景。

視覺大模型應(yīng)用普及將在2026-2030年走向成熟期

活動現(xiàn)場,吳欣鴻還分享了對于AI視覺大模型的思考?!癆I視覺大模型的本質(zhì),是無窮無盡的視覺創(chuàng)意庫。應(yīng)用層相當(dāng)于內(nèi)容提取器,根據(jù)用戶的需求,從這個巨大的創(chuàng)意庫中提取所需要的內(nèi)容,讓用戶在特定場景中使用。AI視覺大模型和應(yīng)用之間相輔相成,大模型為應(yīng)用提供技術(shù)支撐,應(yīng)用反哺大模型的效果迭代?!?/p>

吳欣鴻表示,目前AI視覺大模型在生產(chǎn)端的三個待解決的問題是:垂直領(lǐng)域的極致效果、工作流整合、變現(xiàn)能力。隨著AI視覺大模型和生產(chǎn)端的磨合,這三個問題會被逐步解決。

在吳欣鴻看來,視覺大模型應(yīng)用普及將經(jīng)歷三個階段:2024年之前為探索期,2024-2025年為高速發(fā)展期,2026-2030年為成熟期,隨著視覺大模型在生產(chǎn)端的應(yīng)用走向成熟,視覺大模型將助力千萬設(shè)計場景,引領(lǐng)美學(xué)的升級與社會經(jīng)濟(jì)增長。

此外,美圖公司還公布了6月19日發(fā)布的影像生產(chǎn)力工具最新數(shù)據(jù):AI視覺創(chuàng)作工具“WHEE”的優(yōu)質(zhì)AI效果生成數(shù)已超過550萬張,打造的設(shè)計師生態(tài)也初見成效;AI口播視頻工具“開拍”月活躍用戶數(shù)已突破35萬;桌面端AI視頻編輯工具“WinkStudio”已累計服務(wù)近10萬名視頻創(chuàng)作者;主打AI商業(yè)設(shè)計的“美圖設(shè)計室”正助力近百萬中小電商賣家降本增效;美圖AI助手“RoboNeo”每天幫助近萬名用戶自動修圖,比傳統(tǒng)修圖效率提升35%;AI數(shù)字人生成工具“DreamAvatar”于8月底上線并主打“AI演員”數(shù)字人服務(wù)。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-10-09
美圖自研視覺大模型3.0發(fā)布,全面應(yīng)用于旗下產(chǎn)品
助力電商、廣告、游戲、動漫、影視五大行業(yè)。

長按掃碼 閱讀全文