盤(pán)古大模型賦能華為云MetaStudio數(shù)字內(nèi)容生產(chǎn)線(xiàn),構(gòu)建有“溫度和情感”的企業(yè)應(yīng)用

今天,華為開(kāi)發(fā)者大會(huì)(Cloud)在東莞盛大開(kāi)幕。華為云媒體服務(wù)產(chǎn)品部部長(zhǎng)呂陽(yáng)明在大會(huì)主題演講中帶來(lái)盤(pán)古基礎(chǔ)大模型賦能的MetaStudio數(shù)字內(nèi)容生產(chǎn)線(xiàn),也是華為云MetaStudio的全新升級(jí)。通過(guò)提供模型生成和模型驅(qū)動(dòng)兩大服務(wù),快速生成和驅(qū)動(dòng)數(shù)字人模型,賦能在線(xiàn)教育、文娛直播、企業(yè)會(huì)議等行業(yè)應(yīng)用,從“0101的比特傳輸”走向“有溫度的模型交互”,改變傳統(tǒng)交互方式,重塑內(nèi)容生產(chǎn)。并通過(guò)現(xiàn)場(chǎng)展示數(shù)字人阿拉伯演講視頻生成和數(shù)字人云會(huì)議實(shí)時(shí)驅(qū)動(dòng)引爆全場(chǎng)。

在數(shù)字內(nèi)容產(chǎn)業(yè),內(nèi)容力決定了企業(yè)的競(jìng)爭(zhēng)力。當(dāng)前,AI生成內(nèi)容(AIGC)正在重構(gòu)數(shù)字內(nèi)容生產(chǎn)模式,重新定義內(nèi)容力。企業(yè)在內(nèi)容生產(chǎn)上用到的算力核數(shù)、模型參數(shù)量和行業(yè)知識(shí)數(shù),決定了企業(yè)在內(nèi)容生產(chǎn)上的競(jìng)爭(zhēng)力,因此,知識(shí)力(模型的深度)決定了內(nèi)容力。

華為云基于盤(pán)古基礎(chǔ)大模型,賦能MetaStudio數(shù)字內(nèi)容生產(chǎn)線(xiàn),打造了盤(pán)古數(shù)字人大模型,實(shí)現(xiàn)MetaStudio數(shù)字內(nèi)容生產(chǎn)線(xiàn)全新升級(jí),通過(guò)提供模型生成和模型驅(qū)動(dòng)兩大服務(wù),讓每個(gè)人實(shí)現(xiàn)數(shù)字人自由,幫助企業(yè)構(gòu)筑更強(qiáng)的內(nèi)容力。

數(shù)字人模型生成服務(wù)

基于盤(pán)古基礎(chǔ)大模型,MetaStudio使用了PB級(jí)的音視頻數(shù)據(jù)進(jìn)行訓(xùn)練,構(gòu)建了數(shù)字人通用大模型,包括數(shù)字人形象、動(dòng)作、表情、口型、聲音等;每個(gè)用戶(hù)可以基于數(shù)字人通用大模型,再結(jié)合個(gè)人數(shù)據(jù)進(jìn)行訓(xùn)練,構(gòu)建用戶(hù)自己的數(shù)字人個(gè)性化大模型。

數(shù)字人模型生成服務(wù),可以通過(guò)文字、圖片、視頻等多種模式來(lái)生成數(shù)字人。

·文本生成數(shù)字人:通過(guò)輸入文本,描述希望生成數(shù)字人的樣子,10秒即可生成模型;

·圖片生成數(shù)字人:通過(guò)上傳一張照片,根據(jù)照片中的個(gè)人特征,生成不同類(lèi)型的數(shù)字人,比如風(fēng)格化數(shù)字人、美型數(shù)字人,模型生成時(shí)間僅需30秒;

·視頻生成數(shù)字人:只需要拍攝一段5分鐘的視頻,就可以生成數(shù)字人個(gè)性化大模型,包含用戶(hù)自己的表情、口型、動(dòng)作特征,整個(gè)模型訓(xùn)練過(guò)程只需要1個(gè)小時(shí)。而業(yè)界一般需要訓(xùn)練12個(gè)小時(shí)以上。

數(shù)字人模型驅(qū)動(dòng)服務(wù)

數(shù)字人大模型可以使用多種方式進(jìn)行驅(qū)動(dòng),包括文字、語(yǔ)音、視頻等,通過(guò)驅(qū)動(dòng)向量信息來(lái)驅(qū)動(dòng)數(shù)字人,生成高清視頻。

·文字驅(qū)動(dòng):基于識(shí)別文字的語(yǔ)義和情感,實(shí)現(xiàn)數(shù)字人動(dòng)作和文字的精準(zhǔn)匹配;

·語(yǔ)音驅(qū)動(dòng):通過(guò)多語(yǔ)言泛化技術(shù),一種語(yǔ)言、一次訓(xùn)練,即可使用多種語(yǔ)言驅(qū)動(dòng)數(shù)字人;

·視頻驅(qū)動(dòng):現(xiàn)在業(yè)界大部分?jǐn)?shù)字人都是站在固定點(diǎn)講解,無(wú)法支持移動(dòng),華為云通過(guò)2D視頻,以及2D/3D數(shù)據(jù)的聯(lián)合訓(xùn)練,實(shí)現(xiàn)數(shù)字人走動(dòng)、側(cè)身、手勢(shì)的精確驅(qū)動(dòng)。

華為云MetaStudio數(shù)字內(nèi)容生產(chǎn)線(xiàn),基于盤(pán)古大模型、渲染引擎和實(shí)時(shí)音視頻能力,提供數(shù)字人模型生成服務(wù)和模型驅(qū)動(dòng)服務(wù),聯(lián)合伙伴和開(kāi)發(fā)者,共同構(gòu)建有“溫度和情感”的企業(yè)應(yīng)用。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )