近兩年,小雀斑、柳夜熙、AYAYI等大量網紅數字人的相繼出現,以及虛擬數字技術在《指環(huán)王》和《阿凡達》以及《刺殺小說家》等電影中的廣泛應用,還有北京冬奧會期間數字人在手語解說、節(jié)目直播等眾多場合亮相,使得公眾對數字人的認知上升到了一個新的臺階。
作為數字經濟的重要環(huán)節(jié),數字人為數字經濟的發(fā)展注入了新的動能。于是,各個行業(yè)企業(yè)便涌現出了多個玩家,紛紛基于已有的相關技術和業(yè)務基礎,開始進軍數字人賽道,數字人行業(yè)也由此迎來了一波新的發(fā)展熱潮。
數字人乘風而起
隨著數字人在各行各業(yè)中的應用越來越廣泛,國內數字人市場規(guī)模也在持續(xù)穩(wěn)步增長。根據IDC在《中國AI數字人市場現狀與機會分析2022》報告中預計,到2023年中國AI數字人市場規(guī)模將達102.4億元。而數字人市場之所以將呈現高速增長的態(tài)勢,則與三大利好不無關系。
從政策層面來看,國家政策的大力支持,預示著數字人的前景一片大好。近年來,國內虛擬現實相關產業(yè)備受外界關注,自2016年起,國家就發(fā)布了多項政策支持我國虛擬現實產業(yè)的發(fā)展,并將虛擬現實和增強現實與云計算、大數據、物聯(lián)網、工業(yè)互聯(lián)網、區(qū)塊鏈、人工智能一起列為了數字經濟重點產業(yè)。而虛擬數字人作為虛擬現實產業(yè)重要的應用之一,自然也有望享受到政策利好所帶來的紅利釋放期。
從技術層面來看,數字技術的融合發(fā)展,驅動了數字人進入發(fā)展快車道。其實數字人出現的時間并不算晚,只是受技術應用水平的限制,早期的數字人制作周期長且成本高。而近幾年,隨著CG、語音合成、深度學習算法、自然語言處理等技術的進步,數字人各環(huán)節(jié)制作周期大大縮短、制作成本明顯降低,數字人制作也走向了智能化。堅實的技術基礎,不僅創(chuàng)新了數字人行業(yè)的發(fā)展應用,更是加速了數字人場景化的應用落地。
從環(huán)境層面來看,AIGC技術的逐漸成熟,助力了數字人行業(yè)規(guī)模的拓展。數字人雖然最初多應用于影視、游戲等行業(yè),但隨后應用場景將會不斷拓展。只不過,越復雜的環(huán)境對數字人的信息處理能力、即時互動能力,以及表達能力等都有著更高的要求。而在AIGC的賦能下,數字人內容生產流程將有望得到創(chuàng)新,可助力數字人廣泛與各行業(yè)領域相結合,為數字人描繪出了極大的創(chuàng)作及交互想象空間。
在政策、技術、環(huán)境的多輪驅動下,數字人應用場景將持續(xù)得到拓展與深化。而隨著數字人行業(yè)進入高速發(fā)展期,國內也已出現了諸多相當有競爭力的玩家,這其中,以百度為代表的綜合類互聯(lián)網技術廠商,以及以科大訊飛代表的專長類AI廠商的表現最為突出,優(yōu)勢也最為明顯。
百度“雙輪驅動”
目前來看,數字人雖然已經應用于多個領域,但當前市場上大多的數字人產品精度依舊較低,而百度不僅上線了具備較強的視覺感知和動作控制能力,能夠通過手勢、語音等方式與用戶進行互動的虛擬數字人,還搭建了百度智能云曦靈智能數字人平臺,提供虛擬形象智能交互解決方案,而這些產品的生成,都源于百度為數字人相關開發(fā)提供了絕佳的土壤。
一方面,百度在AI技術上的領先優(yōu)勢,能夠高效率、高質量地推動其數字人技術的迭代升級。眾所周知,數字人的發(fā)展離不開計算機視覺、智能語音、自然語言處理等AI技術的支持,而作為國內唯一一家既有視覺能力,又有語音、語義相關包括計算機圖形學自動生成全鏈路AI能力平臺型的公司,百度已經積累了大量全棧AI能力,而這無疑是其數字人成功落地的實力與底氣。
另一方面,百度標準化、平臺化的優(yōu)勢,可以有效降低運營門檻,助其數字人實現廣泛應用。想要實現“人均一個”數字人,產品標準化、平臺化必不可少。得益于百度在視覺、NLP、語音交互等底層全棧AI技術優(yōu)勢的長期積累,以及PLATO百億參數對話大模型,百度智能云已經將這一能力平臺化、標準化,這不僅使其部署成本更低,周期更短,還可以做到一次部署、一次建設,并在多個場景下形成虛擬數字人能力,實現端到端軟硬一體的商業(yè)應用。
百度憑借無可比擬的AI能力,加之在標準化、平臺化中服務穩(wěn)定、成本低廉等特點,在數字人領域先發(fā)制人,在產品力、市場上走在了行業(yè)前列。據了解,百度智能數字人平臺是世界上首個在線語音交互注意力模型,實現與數字人自然暢通交流,高準確度的音畫同步,逐字口型準確率>98.5%。另外,目前百度終端虛擬人產品,也已經以智能客服的形象,成功落地在了深圳、重慶、鄭州等多個城市的各大地鐵站,全天候為來往的乘客提供最便利的智能咨詢服務。
科大訊飛“三線出擊”
數字人已經成為多家廠商發(fā)力的重點,凡是進入的玩家都在機器視覺、語音交互和自然語言處理等方面有著或多或少的技術積累,而盡管國內諸多互聯(lián)網大廠和科技巨頭都瞄準了數字人賽道,但作為亞太地區(qū)知名的智能語音和人工智能上市企業(yè),科大訊飛同樣在推動數字人產品和場景應用落地上,建立起了自己的優(yōu)勢。
一是,科大訊飛所具有的豐富的技能和問答知識儲備,可以讓其數字人變得更加聰慧智能。一直以來,科大訊飛都在致力于讓機器“能聽會說,能理解會思考”,其開發(fā)的星火大模型不僅在開放式知識問答上取得了突破,其多輪對話、邏輯和數學能力也有所升級。而科大訊飛語言理解、知識問答、邏輯推理等各項能力的持續(xù)提升,能夠使其數字人準確地理解用戶問題,并給出自然、準確的回答,為用戶帶來更為豐富的使用體驗。
二是,科大訊飛在智能語音技術方面的深厚積淀,可以為其數字人的落地提供全鏈路保障。科大訊飛自成立以來,就一直從事著智能語音、自然語言理解、計算機視覺等核心技術的研究,并且其在語音、圖像、自然語言理解、機器認知推理能力、多語種多模態(tài)人機交互等方面的技術和產業(yè)化應用已具有業(yè)界領先水平。得益于此,科大訊飛的數字人也就能得到語音識別、語義理解、語音合成、形象驅動、視頻渲染服務的全鏈路保障。
三是,科大訊飛專屬的數字人定制能力,有助其在眾多廠商中形成差異化優(yōu)勢。科大訊飛可以根據客戶要求,在客戶的不同業(yè)務場景下進行AI虛擬人賦能,為客戶提供一站式、定制化AI虛擬人服務。比如,在服務部署上,可以靈活采用公有云或私有云的部署方案,保障交互服務的安全穩(wěn)定;在形象聲音上,可以根據客戶音色、風格的需求靈活定制專屬的個性化語音庫;在虛擬人形象上,可以支持2D真人形象,從而為客戶定制專有IP形象。
仍需負重前行
在數字時代,數字人已經開始在各個企業(yè)中扮演關鍵角色。然而對于數字人企業(yè)而言,打通產業(yè)鏈各環(huán)節(jié)、修煉技術“內功”,才是打造競爭優(yōu)勢、強化競爭壁壘的關鍵。因此,即便是國內數字人發(fā)展較為成熟的公司,已經在客戶積累、技術實力、銷售渠道、資金供給等方面具備了一定積累,但由于數字人行業(yè)天花板依舊較高,想要維持長期和衍生發(fā)展并不容易。
一方面,國內數字人尚處于起步階段,距離商業(yè)化規(guī)模推廣仍有一定距離。盡管國內諸多企業(yè)的數字人已經實現了場景化應用,但就整體而言,我國數字人行業(yè)發(fā)展仍處于起步階段,不僅尚未跑出一個覆蓋全產業(yè)鏈的數字人企業(yè),大多數企業(yè)在數字人情緒感知、語義理解、情感連接等方面仍有所欠缺。另外,國內各家數字人在細分市場上的產品也都還仍處于試驗可行性的階段,大規(guī)模商業(yè)化暫時還難以實現。
另一方面,海外巨頭的數字人優(yōu)勢明顯,國內企業(yè)想要追趕還需更加努力。國內領先企業(yè)的數字人產品雖然已經頗具特色,但國內企業(yè)更側重AI技術的開發(fā)與內容應用,因此數字人產品大多探索的是其在社交活動、新聞媒體、文旅等領域的應用。而海外巨頭多聚焦于數字人的基礎建設,技術優(yōu)勢較為明顯。比如英偉達、Unity等均基于自身技術優(yōu)勢向下游生產技術服務平臺延伸,相較于國內,其技術壁壘就更為深厚。
目前來看,國內以百度、科大訊飛為代表的科技企業(yè)在數字人上的探索雖然還有一定難度,但值得注意的是,在各個大廠的不斷發(fā)力,以及人工智能技術的大力加持下,數字人的制作運營效率有望得到持續(xù)優(yōu)化,其應用價值也將得到不斷釋放。而隨著百度、科大訊飛不遺余力地加速數字人的進程,其數字人的未來也將會非常值得期待。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。