元宇宙無疑是2021年的概念頂流,在巨頭下場、web 3.0加速構建過程中,虛擬數(shù)字人作為元宇宙的場景入口與連接紐帶也備受矚目。今年的江蘇衛(wèi)視跨年晚會上,周深與鄧麗君跨時空合唱《大魚》刷屏。面對數(shù)字人展現(xiàn)出的眾多可能性,2022年1月14日,百度科技沙龍《AI呀,我去!》第四期以數(shù)字人為主題,為百余位媒體、專家學者展現(xiàn)了數(shù)字人產業(yè)的全景。
會上,百度智能云AI人機交互實驗室負責人李士巖基于多年經驗,圍繞當前數(shù)字人產業(yè)的發(fā)展格局、技術難點和底層驅動力進行了系統(tǒng)分享。李士巖表示,虛擬數(shù)字人產業(yè)格局中,提供建模、渲染、動態(tài)捕捉等服務于數(shù)字人制作的基礎設施服務商已形成穩(wěn)固格局,大多由海外巨頭把持。但在工具、應用層,中國企業(yè)已開始嶄露頭角。
不過,數(shù)字人規(guī)?;涞剡€面臨三大難點:產業(yè)鏈割裂、服務場景與演藝場景沒有有效打通、滿足高頻需求成本高。為系統(tǒng)解決這些難題,百度推出數(shù)字人平臺“曦靈”,未來數(shù)字人生產、內容創(chuàng)作、業(yè)務配置服務將可以在一個平臺上實現(xiàn)全鏈路制作和調優(yōu),降本增效?!拔覀兘鼉赡甑膴^斗目標是,通過百度智能云曦靈平臺的開放,讓每個人實現(xiàn)數(shù)字人自由?!崩钍繋r表示。
數(shù)字人大規(guī)模落地要突破三大難題
目前,數(shù)字人經歷了以“紙片人”為代表的1.0階段,以Vtuber主播為代表的2.0時代,已進化至3.0階段,具備模型高精、人工智能驅動特點的數(shù)字人3.0成為行業(yè)主流。李士巖介紹,第三代數(shù)字人的建模和內容生產均有AI參與,這使得數(shù)字人的制作效率更高,也更智能,能面向更多應用場景。可面向全群體用戶,可由視頻、直播、chatbot等載體承載,更具備千人千面的互動能力。
數(shù)字人3.0已展現(xiàn)出巨大的市場空間。根據(jù)次元光譜不完全統(tǒng)計,2021年國內虛擬偶像/數(shù)字人領域里至少發(fā)生19筆融資,2021年產業(yè)上下游也紛紛從自己擅長的角度切入市場。虛擬數(shù)字人產業(yè)格局中,提供建模、渲染、動態(tài)捕捉等服務于數(shù)字人制作的基礎設施服務商已形成穩(wěn)固格局,大多由海外巨頭把持。不過,在工具、應用層,中國企業(yè)已開始嶄露頭角。
中國企業(yè)中,數(shù)量最多的是資產制作和策劃運營類的公司,比如推出超寫實數(shù)字人的AYAYI燃麥科技,推出虛擬人物柳夜熙的創(chuàng)壹視頻,但這類公司面臨的挑戰(zhàn)是門檻較低、可替代性高。此外,掌握技術和場景的互聯(lián)網(wǎng)公司則扮演綜合性技術服務商的角色,一邊推出基于自身優(yōu)勢場景的數(shù)字人,打造應用標桿;一邊推出數(shù)字人平臺,將產品繼續(xù)落地到更細化的場景中,點、線互相推進。
李士巖表示,數(shù)字人產業(yè)有三大核心推動力,第一級火箭是用戶需求與技術升級、第二級是政策支持與資本涌入、第三級是計算平臺的迭代。“每一次數(shù)字人發(fā)展本質上都是技術推動的,用戶從平面的圖文影音獲取信息與交互,向實時3D交互反饋的需求轉變,將成為數(shù)字人長期發(fā)展的根本動能,未來也將創(chuàng)造大量需求?!袄钍繋r說。
雖然數(shù)字人行業(yè)擁有強勁的驅動力,但李士巖認為,當下國內數(shù)字人要大規(guī)模產業(yè)落地還面臨三大難題。
首先,數(shù)字人產業(yè)鏈各個節(jié)點相對割裂,不能高效協(xié)同,導致數(shù)字人在制作和調優(yōu)上存在較高壁壘,目前行業(yè)中大多數(shù)公司只是數(shù)字人制作與運營全流程上的一環(huán)或其中幾環(huán)。其次,服務場景與演藝場景沒有有效打通,表現(xiàn)為演藝型數(shù)字人不具備客戶所需的業(yè)務能力,而服務型數(shù)字人缺乏人設,難以與用戶進行情感交流。第三是滿足高機動性、高頻需求的成本依舊很高,這一問題歸根結底還是數(shù)字人的生產效率問題。
百度推出數(shù)字人平臺“曦靈”
面對當前數(shù)字人制作的高門檻,2021年12月,百度create大會(百度AI開發(fā)者大會)上,百度CTO王海峰正式發(fā)布了“百度智能云曦靈數(shù)字人平臺”, 搭建集數(shù)字人生產、內容創(chuàng)作、業(yè)務配置服務為一體的平臺級產品。目前該產品已具備標準平臺的快速交付能力,幫助不同領域客戶快速實現(xiàn)敏捷型需求,降本增效。百度的數(shù)字人平臺曦靈具有全場景、一站式、平臺化的特點,能支持從最初數(shù)字人形象定制、人設管理再到業(yè)務編排、內容創(chuàng)作,最后到多種驅動模式下與用戶互動的全部需求,這也意味著在一個平臺上即可實現(xiàn)數(shù)字人的全鏈路調優(yōu),從而將效果做到最好。
李士巖以數(shù)字人生成環(huán)節(jié)為例,演示了百度智能云曦靈平臺的功能。用戶在百度智能云曦靈平臺上傳一張照片,就能快速生成一個可被AI驅動的2D數(shù)字人像,以前需要兩三個月時間做出來的3D數(shù)字人,現(xiàn)在可以壓縮到小時級,同時還可以通過一句話語音描述或簡單捏臉等多種形式快速生產數(shù)字人。數(shù)字人個性化功能開發(fā)也較之前更加完善,以百度剛剛發(fā)布的3D超寫實口語數(shù)字人為例,其口型合成準確率高達98.5%。
在技術催生的數(shù)字人3.0階段,虛擬人可與不同行業(yè)產生更緊密的融合?;谑袌鍪褂脠鼍?,數(shù)字人可以分為演藝型數(shù)字人、服務型數(shù)字人兩類。
演藝術型數(shù)字人包括虛擬主播、虛擬偶像以及數(shù)字孿生的虛擬品牌代言人。目前百度已經打造了AI手語主播、央視網(wǎng)虛擬主持人小C、航天局火星車數(shù)字人祝融號、百度虛擬代言人希加加、百度APP代言人龔俊數(shù)字人。
服務型數(shù)字人包括數(shù)字員工、虛擬員工、虛擬業(yè)務員等,可以幫助金融、運營商、政府、零售等行業(yè)提供基于數(shù)字人的新一代客戶服務能力,解決排隊長、回應慢、人力成本大等問題。目前,百度已經和浦發(fā)銀行、光大銀行、中國聯(lián)通合作,推出了一對一服務型數(shù)字人。
百度在數(shù)字人技術上的突破也得益于其在行業(yè)內的持續(xù)布局。早在2019年,百度就開始了“虛擬數(shù)字人戰(zhàn)略”?;诙嗄甑腁I技術沉淀, AI能力已成為百度智能云曦靈平臺的核心能力,現(xiàn)在百度也在把這種能力開放給外界。李士巖表示,“我們近兩年的奮斗目標是通過百度智能云曦靈平臺的開放,讓每個人實現(xiàn)數(shù)字人自由?!?/strong>
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 美國無人機禁令升級?當?shù)乜茖W家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實力
- 自動駕駛第一股的轉型迷途:圖森未來賭上了AIGC
- 明星熱劇、品牌種草、平臺資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機看它就夠了!
- 游戲體驗天花板,一加 Ace 5 系列售價 2299 元起
- 16個月沒工資不敢離職,這些打工人“自費上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問界M9,中國豪華車的龍門一躍
- 科技云報道:人工智能時代“三大件”:生成式AI、數(shù)據(jù)、云服務
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。