數(shù)字人技術(shù)是“元宇宙”的任督二脈

1982年7月9日,好萊塢上映了一部對(duì)后世影響極大的科幻電影,《電子世界爭(zhēng)霸戰(zhàn)》。

影片講述的是一個(gè)黑客程序員,進(jìn)入電子世界中,在自己所開(kāi)發(fā)的游戲里作戰(zhàn)。這個(gè)故事在《頭號(hào)玩家》、《失控玩家》遍地的當(dāng)下,并沒(méi)有什么好稀奇的,但在當(dāng)時(shí),它準(zhǔn)確地開(kāi)啟了一個(gè)時(shí)代。

從技術(shù)上來(lái)說(shuō),《電子世界爭(zhēng)霸戰(zhàn)》是全世界范圍內(nèi)第一部采用“CG+真人結(jié)合”的方式完成特效的電影,被認(rèn)為是開(kāi)創(chuàng)了CG制作電腦的新紀(jì)元。而從文本或者說(shuō)哲學(xué)的角度來(lái)看,這部影片的影響更為深遠(yuǎn),自此之后,電影對(duì)世界本源的追溯從未停止。

《電子世界爭(zhēng)霸戰(zhàn)》之后的第7年,日本漫畫(huà)師士郎正宗創(chuàng)作出了《攻殼機(jī)動(dòng)隊(duì)》,并在1995年由押井守搬上了大熒幕,名聲大噪。

1999年,深受《電子世界爭(zhēng)霸戰(zhàn)》和《攻殼機(jī)動(dòng)隊(duì)》影響的沃卓斯基兄弟如今已是姐弟創(chuàng)作出了《黑客帝國(guó)》,這部作品是以“現(xiàn)實(shí)+虛擬”為世界觀構(gòu)架的集大成作品,至今無(wú)人能望其項(xiàng)背。

所以,從電影史的歷程來(lái)看,今年以來(lái)大火的“元宇宙”,其文本雖然是1992的尼奧·斯蒂文森在小說(shuō)《雪崩》中提出來(lái)的,但具體的概念,應(yīng)該是更遙遠(yuǎn)的1982年。

01

《電子世界爭(zhēng)霸戰(zhàn)》的影像風(fēng)格如今看來(lái)非常“五毛”,是一種典型的像素風(fēng)。當(dāng)時(shí)的CG技術(shù),僅僅只能支撐對(duì)人體關(guān)節(jié)部位的動(dòng)作替代,沒(méi)有辦法對(duì)臉部進(jìn)行特效處理,否則就將成為徹徹底底的卡通片。因此只能夠使用“CG+真人結(jié)合”的方式。

而在2010年,這部影片進(jìn)行了重拍,重拍之后的《創(chuàng):戰(zhàn)紀(jì)》視聽(tīng)效果獲得了極大的提升,還獲得了當(dāng)年奧斯卡最佳音效獎(jiǎng),但仍然延續(xù)的是“CG+真人結(jié)合”的拍攝模式。

與近年來(lái)上映的《頭號(hào)玩家》和《失控玩家》對(duì)比,影像技術(shù)近十年來(lái)獲得了很大的提升。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,看似遙遠(yuǎn)的“元宇宙”世界,其實(shí)并非海市蜃樓般遙遠(yuǎn),而要實(shí)現(xiàn)它,虛擬世界中的數(shù)字成像技術(shù)是最需要攻克的難題。

數(shù)字人,則可能是開(kāi)啟元宇宙時(shí)代的“任督二脈”。

從最基礎(chǔ)的文本交互,到語(yǔ)音互動(dòng),再到融合了視覺(jué)、語(yǔ)音及語(yǔ)義技術(shù)的多模態(tài)數(shù)字人交互,我們對(duì)虛擬世界中的交流需求越來(lái)越高,數(shù)字人的概念隨之逐漸火熱。

那么,數(shù)字人技術(shù)的實(shí)現(xiàn)有哪些難點(diǎn)呢?

作為“數(shù)字新物種”,數(shù)字人的真實(shí)感來(lái)源于形象的表現(xiàn)力。相比文字、語(yǔ)音交互產(chǎn)品,數(shù)字人加入了視覺(jué)元素,這就需要一個(gè)更加逼真、更具表現(xiàn)力的形象來(lái)滿足用戶的視覺(jué)需求,讓用戶能夠有充足的交互沉浸感。這樣的表現(xiàn)力需要做到數(shù)字人的聲音、形象、嘴型、表情的一致性。

此外,相關(guān)的運(yùn)算和處理需要在與用戶對(duì)話的過(guò)程中實(shí)時(shí)生成,對(duì)于AI算法和計(jì)算機(jī)的性能也要求較高。當(dāng)傳遞的信息從簡(jiǎn)單的文字信息,變成復(fù)雜的音視頻信息,只有同時(shí)具備自然語(yǔ)言理解(NLP)、語(yǔ)音識(shí)別和生成,視覺(jué)合成這樣的整體AI能力,才能給用戶一個(gè)自然逼真的體驗(yàn)。

舉個(gè)例子,“捏臉”是每個(gè)數(shù)字人誕生的過(guò)程中最為重要的環(huán)節(jié),也是長(zhǎng)期以來(lái)數(shù)字人的誕生過(guò)程中最耗時(shí)的部分。關(guān)于這道題的解法,Epic Games提供了一套解法。通過(guò)工具實(shí)現(xiàn)從嘴唇伸縮到眼睛距離、皮膚顏色、牙齒形狀、皺紋形態(tài)、毛細(xì)血管和胡須的自定性,創(chuàng)作者可以自定義所有內(nèi)容,自由地“捏”出想要的人臉,例如抬起或放下眉毛,改變頜骨的形狀和耳朵的高度,甚至睫毛的長(zhǎng)度也是可以改變的。并且,隨著光影變化,光線在不同膚色、不同年齡、不同性別的角色上均會(huì)呈現(xiàn)出不同的效果。

而數(shù)字人如何表現(xiàn)得像個(gè)“人類(lèi)”,提供更為合適的交互手段,也是亟待解決的問(wèn)題。盡管現(xiàn)在人工智能已經(jīng)越來(lái)越普遍地被運(yùn)用在互聯(lián)網(wǎng)上,包括人工智能客服、自動(dòng)化流程、自動(dòng)化工具,甚至是像AlphaGo這樣的人工智能玩家。可以說(shuō),人工智能技術(shù)的發(fā)展,已經(jīng)可以基本滿足用戶的需求。但人工智能長(zhǎng)期以來(lái)被用戶所詬病的就在于:始終呈現(xiàn)的是冷冰冰的文字形象,這樣偏二維世界的體驗(yàn)并沒(méi)有與網(wǎng)絡(luò)技術(shù)和人工智能的發(fā)展相匹配,這種體驗(yàn)和我們現(xiàn)在看《電子世界爭(zhēng)霸戰(zhàn)》是一樣的。

因此實(shí)現(xiàn)數(shù)字人的人格化、讓數(shù)字人的行為動(dòng)作“像個(gè)人類(lèi)”至關(guān)重要。

關(guān)于這點(diǎn),行業(yè)內(nèi)也有眾多失敗案例。2018年,瑞典一家銀行就曾經(jīng)“開(kāi)除”了一名“表現(xiàn)不佳”的數(shù)字人。最直接的理由就是Amelia的業(yè)績(jī)表現(xiàn)沒(méi)能達(dá)到預(yù)期。盡管Amelia被認(rèn)為是世界上最好的AI系統(tǒng)之一,并被廣泛地應(yīng)用于醫(yī)療和金融行業(yè),但其中欠缺的人格化,也是眾多用戶摒棄數(shù)字人的原因。

02

8月,芯片巨頭NVIDIA的真假“皮衣教主事件”,將數(shù)字人推向熱度至高點(diǎn)。部分媒體當(dāng)時(shí)稱“NVIDIA欺騙了全世界”,英偉達(dá)CEO黃仁勛某次兩個(gè)小時(shí)線上演講,全程數(shù)字人出面,從家居背景到人物、服裝等均是虛擬AI能力展示。盡管黃仁勛的“數(shù)字人”只出現(xiàn)了14秒,其他部分均為真人演講,但仍向外界傳遞了數(shù)字人技術(shù)未來(lái)具有無(wú)限的可能性。

其實(shí),數(shù)字人距離生活已不遙遠(yuǎn),虛擬主播、虛擬教師、虛擬明星、虛擬客服……數(shù)字人的形象正在愈發(fā)立體和全面地展示在我們的生活中,讓以商業(yè)和技術(shù)為導(dǎo)向的數(shù)字經(jīng)濟(jì)多了些溫情和煙火氣。

據(jù)量子位智庫(kù)發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)分析報(bào)告》顯示,截至2030年,圍繞虛擬數(shù)字人我國(guó)將會(huì)形成一個(gè)高達(dá)2700億的藍(lán)海市場(chǎng)。而這個(gè)市場(chǎng)也并不單一,將圍繞著包括游戲影視、服務(wù)平臺(tái)、媒體平臺(tái)、醫(yī)學(xué)等更豐富的領(lǐng)域展開(kāi)。

用戶對(duì)于數(shù)字體驗(yàn)“真實(shí)化”的需求永不止步,在數(shù)字文化產(chǎn)業(yè)領(lǐng)域,數(shù)字人最基本的應(yīng)用就在于對(duì)游戲、影視作品沉浸感的提升。Epic Game的虛幻引擎被廣泛應(yīng)用,在虛幻引擎的官網(wǎng),Epic Games是這樣定義數(shù)字人技術(shù)對(duì)于游戲行業(yè)的影響的:A world of possibilities。通過(guò)技術(shù),Epic Games實(shí)現(xiàn)了游戲人物的“高保真化”。隨著近幾年人工智能技術(shù)的不斷演進(jìn),游戲行業(yè)中涌現(xiàn)的一些新技術(shù)讓數(shù)字人的制作過(guò)程得到了有效地簡(jiǎn)化,使得數(shù)字人成功地進(jìn)入了公眾的視野之中。

數(shù)字人甚至已經(jīng)被運(yùn)用至眾多非娛樂(lè)產(chǎn)業(yè),展現(xiàn)出了其強(qiáng)大的“功能性”價(jià)值。

虛擬互動(dòng)技術(shù)的擴(kuò)展,讓數(shù)字人已經(jīng)可以發(fā)揮一些常人無(wú)法企及的作用,例如醫(yī)學(xué)、礦產(chǎn)、航空航天等領(lǐng)域。此外,通過(guò)定制主持人形象,也可以實(shí)現(xiàn)內(nèi)容快速、自動(dòng)化的生產(chǎn),優(yōu)化觀看體驗(yàn)。例如,在神州十二號(hào)成功發(fā)射三位航天員順利抵達(dá)空間站后不久,由新華社和騰訊聯(lián)合打造、專(zhuān)門(mén)面向航天主題和場(chǎng)景研發(fā)的數(shù)字航天員、國(guó)內(nèi)首個(gè)進(jìn)入多場(chǎng)景運(yùn)營(yíng)的數(shù)字人“小諍”亮相,帶用戶漫游三大空間站。截至目前“小諍”已經(jīng)完成了多次太空?qǐng)?bào)道,涵蓋了“天問(wèn)一號(hào)”火星探測(cè)任務(wù)和中國(guó)空間站。這種效率從側(cè)面說(shuō)明了當(dāng)前數(shù)字人技術(shù)的成熟度已經(jīng)到達(dá)了一定的水平。

除了功能性的應(yīng)用以外,數(shù)字人同樣具有“人文關(guān)懷”的功用。通過(guò)基于真人形象,打造出具有高度關(guān)懷感和真實(shí)感的多模態(tài)AI助手型虛擬數(shù)字人。這種虛擬數(shù)字人在特定關(guān)懷類(lèi)場(chǎng)景乃至通用化交互中,可以提供顧問(wèn)、關(guān)懷、陪伴,以及事務(wù)處理等服務(wù)。國(guó)外廠商已有的落地場(chǎng)景包括個(gè)性化理財(cái)顧問(wèn)、心理咨詢顧問(wèn)和購(gòu)物助理等。

03

《電子世界爭(zhēng)霸戰(zhàn)》發(fā)布后的近四十年,外界對(duì)于“現(xiàn)實(shí)和虛擬”的二元對(duì)立討論,幾乎從未停止,并在《黑客帝國(guó)》上映后達(dá)到巔峰。但此前討論更多聚焦的是哲學(xué)層面,而技術(shù)層面能否實(shí)現(xiàn),以及如何實(shí)現(xiàn),還是近段時(shí)間被行業(yè)所關(guān)注。

2020年,馬化騰提到了“全真互聯(lián)網(wǎng)”的概念,他認(rèn)為互聯(lián)網(wǎng)的下一步就是虛擬世界和真實(shí)世界的大門(mén)完全敞開(kāi)。一個(gè)由游戲和虛擬空間組成的經(jīng)濟(jì)崛起。

從相關(guān)技術(shù)的匹配和發(fā)展路徑而言,游戲公司在元宇宙的崛起中將起到至關(guān)重要的作用。而最關(guān)鍵的一步就是持續(xù)拓展元宇宙的內(nèi)容生態(tài),即把握數(shù)字人的發(fā)展。

換句話說(shuō),如果把元宇宙當(dāng)做一款3A大作,再?gòu)?qiáng)大的3A游戲也跟不上玩家的消耗,只有這樣源源不斷地創(chuàng)新,才能保持新鮮感,進(jìn)而推動(dòng)整個(gè)社會(huì)進(jìn)入全真互聯(lián)網(wǎng)時(shí)代。

現(xiàn)在,互聯(lián)網(wǎng)和社交平臺(tái)的超高速發(fā)展已經(jīng)極大地拓展了人們的社會(huì)關(guān)系?,F(xiàn)有形式的社交平臺(tái)的發(fā)展和用戶增長(zhǎng)已經(jīng)觸及天花板,急需新的增長(zhǎng)路徑,才能幫助互聯(lián)網(wǎng)行業(yè)重新找回快速增長(zhǎng)的節(jié)奏。元宇宙和數(shù)字人技術(shù)就是這樣的路徑關(guān)鍵點(diǎn)。只不過(guò),而要想真正實(shí)現(xiàn)類(lèi)似《失控玩家》和《頭號(hào)玩家》電影中的游戲世界,元宇宙還有一段很長(zhǎng)的路要走。

但現(xiàn)在我們做出的關(guān)于元宇宙的投資和決策,都將決定元宇宙的未來(lái)面貌。一篇來(lái)自Medium的文章提到,元宇宙的構(gòu)成與“硬件”“內(nèi)容”以及“構(gòu)成世界的底層框架”息息相關(guān),涵蓋了元宇宙的體驗(yàn)層、發(fā)現(xiàn)層、創(chuàng)作者經(jīng)濟(jì)層、空間計(jì)算層、去中心化層、人機(jī)界面層以及基礎(chǔ)設(shè)施層七大要素。在目前的發(fā)展階段下,盡管各大互聯(lián)網(wǎng)巨頭入局,但元宇宙的硬件層面尚未取得質(zhì)變;因此內(nèi)容和構(gòu)成世界的底層框架就成為了當(dāng)下進(jìn)軍元宇宙的發(fā)力點(diǎn)。

毫無(wú)疑問(wèn),元宇宙的“沉浸感”是體驗(yàn)的至高標(biāo)準(zhǔn)。想要?jiǎng)?chuàng)造這種“沉浸感”,需要“高保真”的游戲環(huán)境。因此,數(shù)字人技術(shù)+突破性的硬件是進(jìn)入元宇宙時(shí)代的先決條件,數(shù)字人技術(shù)可以賦能組成元宇宙的各種元素,突破性的硬件能夠?qū)⑷说囊庾R(shí)從外部世界和虛擬世界進(jìn)行串聯(lián),二者結(jié)合才可搭建出一個(gè)與現(xiàn)實(shí)世界別無(wú)二致的虛擬世界。

截至目前,數(shù)字人的高保真技術(shù)日漸成熟。從數(shù)字人的外形構(gòu)造來(lái)看,不論是Epic Game還是NExT Studios均已經(jīng)在數(shù)字人面部的細(xì)節(jié)還原方面取得眾多進(jìn)展,且達(dá)到了實(shí)用的水平。隨著拍照式相機(jī)陣列掃描重建得到飛速發(fā)展,目前可實(shí)現(xiàn)毫秒級(jí)高速拍照掃描,成為當(dāng)前人物建模主流方式,并成功應(yīng)用于游戲、電影、傳媒等行業(yè)。同時(shí),通過(guò)實(shí)時(shí)動(dòng)作捕捉系統(tǒng)將人物動(dòng)作還原,也使得各類(lèi)型互動(dòng)體驗(yàn)成為了可能。

數(shù)字人的“高保真”,也體現(xiàn)在整體環(huán)境和交互體驗(yàn)的深度還原:運(yùn)用虛幻引擎、實(shí)時(shí)光線追蹤技術(shù)等等,創(chuàng)作出更為真實(shí)、沉浸感更強(qiáng)的模擬效果和視覺(jué)體驗(yàn)。

作為新生事物,數(shù)字人雖然進(jìn)入實(shí)用階段,但仍尚屬“稚嫩”。關(guān)于數(shù)字人未來(lái)發(fā)展的方向,也需要更多地思考。誰(shuí)也無(wú)法預(yù)測(cè)數(shù)字人和元宇宙最后的發(fā)展結(jié)果。我們目前對(duì)于元宇宙的眾多想象,也只是基于影視作品的天馬行空。

元宇宙的實(shí)現(xiàn),需要人工智能來(lái)進(jìn)行源源不斷的內(nèi)容供給,利用AI推動(dòng)各行各業(yè)完成現(xiàn)實(shí)世界和虛擬世界的鏈接;也需要VRAR技術(shù)的持續(xù)進(jìn)步,不斷加強(qiáng)用戶的沉浸感和體驗(yàn)感;需要心理學(xué)知識(shí),讓元宇宙超脫出“數(shù)字組成的冰冷世界”的概念,數(shù)字也同樣具有溫度;甚至,元宇宙的實(shí)現(xiàn)也需要區(qū)塊鏈,保障新世界中的身份、資產(chǎn)、社會(huì)關(guān)系,以建立元宇宙的公信力。

就目前而言,關(guān)于元宇宙我們能做的,就是先搭建好組成宇宙中各個(gè)元素的基礎(chǔ)。

但總有一天,我們會(huì)在《電子世界爭(zhēng)霸戰(zhàn)》所描繪的那個(gè)世界中相見(jiàn)。(來(lái)源:獵云網(wǎng))

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2021-09-15
數(shù)字人技術(shù)是“元宇宙”的任督二脈
關(guān)于元宇宙我們能做的,就是先搭建好組成宇宙中各個(gè)元素的基礎(chǔ)。

長(zhǎng)按掃碼 閱讀全文