5月10日,中科深智在北京正式發(fā)布GenSense數(shù)智姜尚大模型,具備輕量級(jí)、可私有化部署等優(yōu)勢?;贕enSense數(shù)智姜尚大模型,其提出的“基于生成式AI提供全流程、端到端3D虛擬人服務(wù)”的戰(zhàn)略正式達(dá)成,除了適用于虛擬直播、數(shù)字員工等成熟場景以外,還可進(jìn)一步適用于對(duì)私有化部署需求更高的金融、醫(yī)療、政企等專業(yè)領(lǐng)域。
深耕基于生成式AI的3D虛擬人賽道
作為生成式AI虛擬人和3D AIGC技術(shù)領(lǐng)導(dǎo)者,中科深智此前已憑借自主研發(fā)的跨多模態(tài)深度學(xué)習(xí)算法——CLAP算法,通過持續(xù)的不同模態(tài)數(shù)據(jù)的關(guān)聯(lián)和交叉訓(xùn)練,獲得了優(yōu)異的基于語音語義實(shí)時(shí)生成動(dòng)作和表情能力。
這些實(shí)時(shí)生成的動(dòng)作和表情數(shù)據(jù),通過中科深智自研的重定向算法介導(dǎo),即可最終驅(qū)動(dòng)虛擬人,從而完成生成式AI虛擬人的技術(shù)閉環(huán)。
以生成式AI虛擬人技術(shù)為核心,中科深智打造了生成式虛擬人實(shí)時(shí)動(dòng)作表情驅(qū)動(dòng)業(yè)務(wù)中臺(tái)Motionverse,可以使用音頻源、文本源、傳感器、語義、腳本等多模態(tài)輸入方式,通過生成式AI技術(shù)方案,實(shí)現(xiàn)虛擬人的身體動(dòng)作、面部表情以及口型的實(shí)時(shí)驅(qū)動(dòng),提供SDK和管理后臺(tái),解決產(chǎn)品和終端的虛擬人驅(qū)動(dòng)問題。
GenSense數(shù)智姜尚大模型賦予虛擬人實(shí)時(shí)互動(dòng)能力
本次發(fā)布會(huì)上,中科深智正式對(duì)外發(fā)布了GenSense數(shù)智姜尚大模型,并現(xiàn)場演示了其在數(shù)學(xué)運(yùn)算、邏輯推理、日常對(duì)話等領(lǐng)域的互動(dòng)表現(xiàn)。據(jù)中科深智CTO宋健介紹,GenSense數(shù)智姜尚是針對(duì)垂直領(lǐng)域、和虛擬人端到端應(yīng)用而專門設(shè)計(jì)的大語言模型,可成為虛擬人的“大腦”,為其提供實(shí)時(shí)互動(dòng)能力支撐。
中科深智創(chuàng)始人兼CEO成維忠認(rèn)為,ChatGPT對(duì)整個(gè)虛擬人市場的影響比想象中要大得多。這個(gè)組合讓用戶發(fā)現(xiàn),虛擬人也是可以做實(shí)時(shí)交互的。不同于此前對(duì)于虛擬人的需求主要集中于“外在”表現(xiàn),用戶需要的是具有強(qiáng)大實(shí)時(shí)互動(dòng)能力的虛擬人。
而GenSense數(shù)智姜尚大模型將能填補(bǔ)以往數(shù)字人只能“依照”指令進(jìn)行反饋、而無“自主”互動(dòng)能力的缺陷,成為虛擬人真正意義上的“大腦”。而基于中科深智此前積累的跨多模態(tài)深度學(xué)習(xí)算法——CLAP算法,能夠?qū)⑻摂M人的“大腦”和形體表現(xiàn)進(jìn)一步有機(jī)融合:由GenSense數(shù)智姜尚大模型對(duì)外界互動(dòng)作出實(shí)時(shí)反饋、并直接驅(qū)動(dòng)虛擬人進(jìn)行生動(dòng)地表達(dá),復(fù)現(xiàn)一個(gè)有“智力”、有良好表現(xiàn)力和表達(dá)能力的3D虛擬人。
可私有化部署,匹配專業(yè)級(jí)應(yīng)用場景
在與ChatGPT背后的GPT模型能力類似的前提下,中科深智GenSense數(shù)智姜尚大模型還具備輕量化、可私有化部署等特點(diǎn)。據(jù)宋健介紹,GenSense數(shù)智姜尚大模型更加輕巧便利,本場展示的分別是200億和20億兩種參數(shù)量的大模型,占用資源相比前者極少,甚至只需要一塊NVIDIA GeForce RTX 3090顯卡便能良好運(yùn)行。
在現(xiàn)場,中科深智還重點(diǎn)將20億參數(shù)量級(jí)版本的大模型,同ChatGPT及其他知名大廠的大模型進(jìn)行了同場測試,來驗(yàn)證在參數(shù)量縮小的前提下效果如何,能否滿足企業(yè)需要。從現(xiàn)場的對(duì)比表現(xiàn)來看,效果很不錯(cuò),實(shí)際體驗(yàn)的差別并沒有參數(shù)量級(jí)差別那么大。這也是國內(nèi)商用大模型在輕量化領(lǐng)域內(nèi)的首次嘗試,有特別重要的商業(yè)意義。
因此,GenSense數(shù)智姜尚大模型更加適合對(duì)數(shù)據(jù)安全性要求更高的金融、醫(yī)療、政企、能源等行業(yè)用戶進(jìn)行私有化部署應(yīng)用。此類領(lǐng)域大多存在數(shù)據(jù)敏感性高等特點(diǎn),而市場上大多數(shù)大模型產(chǎn)品由于對(duì)算力要求較高,難以進(jìn)行私有化部署,導(dǎo)致無法滿足此類客戶的需求。
而更加輕量化的GenSense數(shù)智姜尚大模型,不僅能夠滿足此類行業(yè)客戶對(duì)于性能上的需求,同時(shí)可以進(jìn)行私有化部署,可以更加深度地結(jié)合企業(yè)現(xiàn)有工作流,同時(shí)其訓(xùn)練方式簡單,非常便于和現(xiàn)有數(shù)據(jù)進(jìn)行集成。
形成全流程、端到端的實(shí)時(shí)3D虛擬人服務(wù)能力
在發(fā)布GenSense數(shù)智姜尚大模型后,中科深智已實(shí)現(xiàn)了包括自有大模型、自主核心算法、系列3D AIGC產(chǎn)品、生成式AI虛擬人解決方案的“全家桶”級(jí)服務(wù)能力。
此前其基于自主核心算法、生成式AI虛擬人和Motionverse業(yè)務(wù)中臺(tái)等底層技術(shù),打造的超寫實(shí)虛擬人生成系統(tǒng)Anyhuman,以及元宇宙電商百寶箱——自動(dòng)播,支持電商全平臺(tái)3D虛擬人主播、虛擬直播間、虛擬人客服、虛擬人直播助理等可視化RPA功能,可以大幅增強(qiáng)虛擬人電商直播交互及時(shí)性、播報(bào)趣味性,在電商直播領(lǐng)域服務(wù)客戶3000+家,市占率超70%。
而對(duì)于更廣泛的行業(yè)用戶,中科深智還提供了基于生成式AI技術(shù)的3D AIGC動(dòng)畫視頻創(chuàng)作平臺(tái)——自動(dòng)畫,是包括虛擬人捏臉、自動(dòng)生成虛擬場景、自動(dòng)生成物品等一站式3D動(dòng)畫創(chuàng)作平臺(tái)。
此外還有一款高效的虛擬人實(shí)時(shí)交互產(chǎn)品——云小七,支持自定義虛擬人形象和聲音,通過生成式AI技術(shù)實(shí)時(shí)驅(qū)動(dòng)虛擬人表情和動(dòng)作,還會(huì)說不同的方言和口音。
另外,通過發(fā)布會(huì)現(xiàn)場的演示環(huán)節(jié)可以看出,GenSense數(shù)智姜尚大模型和中科深智各項(xiàng)數(shù)字人技術(shù)及產(chǎn)品聯(lián)動(dòng)高效、流暢,展現(xiàn)了非常出色的實(shí)時(shí)互動(dòng)效果和生動(dòng)的表現(xiàn)、表達(dá)能力,非常有新意,也展現(xiàn)了中科深智在虛擬人方面的深厚積累。
通過以上底層技術(shù)和產(chǎn)品,中科深智可以SaaS和PaaS模式、或提供垂直領(lǐng)域解決方案,賦能不同行業(yè)和場景,實(shí)現(xiàn)了基于生成式AI提供全流程、端到端3D虛擬人服務(wù)的戰(zhàn)略目標(biāo)。
關(guān)于中科深智
中科深智是一家專注于端到端生成式AI虛擬人技術(shù)的公司,從底層自研的大語言模型、動(dòng)作和表情生成算法模型以及3D自動(dòng)建模 ,到Motionverse虛擬人業(yè)務(wù)中臺(tái),再到3D AIGC產(chǎn)品和應(yīng)用層。中科深智除了為生態(tài)合作伙伴提供AI虛擬人API外,還開發(fā)了一系列3D AIGC產(chǎn)品,包括超寫實(shí)虛擬人生成系統(tǒng)Anyhuman、元宇宙電商和虛擬人直播工具百寶箱自動(dòng)播、AI快速動(dòng)畫生成系統(tǒng)自動(dòng)畫、虛擬人實(shí)時(shí)交互和應(yīng)答系統(tǒng)云小七等。
中科深智成立于2016年,由中科大校友創(chuàng)建,曾獲得北京市“專精特新”中小企業(yè)榮譽(yù),擁有超過100項(xiàng)發(fā)明專利,與國際公司如英偉達(dá)、Unity、UE Metahuman合作,擁有數(shù)千家合作伙伴。中科深智的投資方包括英諾天使、金沙江創(chuàng)投、MYEG、晨山資本等知名投資機(jī)構(gòu)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )