原標題:與朱廣權在線battle,百度智能云AI手語主播正式上崗
近日,一則段子手朱廣權與“手語主播”在線pk的視頻火了,剛剛上線播放量就突破百萬。視頻中,朱廣權用超快語速的順口溜挑戰(zhàn)“手語主播”的“手速”,而這位手語主播也憑過硬的專業(yè)能力輕松應戰(zhàn)。事實上,這位手語主播不是真人,而是一位虛擬數(shù)字人。
這位數(shù)字人是由“百度智能云曦靈”數(shù)字人平臺打造的首個AI手語主播。她形象親切自然,專業(yè)能力出色,在剛剛開啟的冰雪賽事中,百度智能云AI手語主播已經上線,為聽障用戶提供24小時的手語服務,讓他們也能快捷地獲取賽事資訊。
(AI手語主播)
據(jù)統(tǒng)計,全球約有4.3億人患中度及以上聽力障礙,根據(jù)全國第二次殘疾人抽樣調查數(shù)據(jù),中國有聽障人士2780萬。他們雖然聽不到賽場的聲音,但同樣希望感受賽事的精彩。AI手語數(shù)字人無疑成為了他們觀賽的重要橋梁。
百度集團副總裁吳甜表示:“百度已發(fā)布集數(shù)字人生產、內容創(chuàng)作、業(yè)務配置服務為一體的智能數(shù)字人平臺——百度智能云曦靈,百度希望通過領先的全棧AI能力,把虛擬人的生產周期縮短到小時級別,降低生產成本,并且用AI驅動生成內容?!?/p>
研發(fā)一款AI手語主播有多難?
手語數(shù)字人的本質是在解決翻譯問題。
區(qū)別于傳統(tǒng)翻譯,手語翻譯的難點在于:手語并非按照語言逐字翻譯,而需要根據(jù)語句整體意思進行語言精煉和語序調整,同時還需實時配合表情和唇語,幫助聽障者更好的理解。這就導致AI手語數(shù)字人在信息凝練度、低時延和精細化三方面面臨極其復雜的技術難題。因此,AI手語主播不僅需要具備高精度的數(shù)字人形象,還需要具備能夠語音識別、手語翻譯和手語表達的AI大腦。
(AI手語主播面部細節(jié)圖)
從外形看,對比以往AI主播形象,百度智能云打造的AI手語主播不僅高度還原真人發(fā)膚,且在立體感、靈活度、可塑性上都有大幅提升。據(jù)悉,百度智能云建立了規(guī)模龐大的手語動作庫,基于《國家通用手語詞典》規(guī)范,結合動作捕捉設備和真實手語老師的雙向調優(yōu),精修近1萬個手語動作,保證了手語表達的動作準確性。同時首創(chuàng)4D掃描技術,使得AI手語主播表情自然生動,口型生成準確度高達98.5%。
而她的“AI大腦“則依托于百度智能云。通過百度自主研發(fā)的機器翻譯技術,百度智能云構建出?套精確的手語翻譯引擎,可懂度達到85%以上,媲美主流的中英、中日等方向的機器翻譯結果,達到業(yè)界領先水平,結合百度自研的語音識別技術,可將冰雪賽事的文字及音視頻內容,快速精準的轉化為手語;同時再通過專為手語優(yōu)化的自然動作引擎,完成AI手語主播的動作驅動,實時演繹為數(shù)字人的動作、表情和唇語。這保證了AI手語主播具備高可懂度的手語表達能力和精準連貫的呈現(xiàn)效果。
據(jù)了解,如此復雜的數(shù)字人研發(fā)工作,百度只用了不到2個月。百度方面表示,虛擬數(shù)字人要為人類提供服務、與人自然地交流,需要背后強大的知識體系和對話能力支撐。百度知識圖譜積累的5500億知識,幫助數(shù)字人擁有“自己”的經驗和認識去思考?;诎俣热ツ臧l(fā)布的百億參數(shù)對話模型PLATO,虛擬人可以跟用戶進行有料、有趣、有情感的交流。
百度智能云曦靈數(shù)字人平臺:半小時生成2D數(shù)字人、一兩周制作完成3D數(shù)字人
目前,數(shù)字人尚未實現(xiàn)規(guī)?;a業(yè)落地,主要原因在于數(shù)字人制作技術門檻高、周期長、成本高。打造一個高精度、高保真的非特異型虛擬人,動輒就需要百萬甚至上千萬的資金投入。
2021年12月,百度發(fā)布了集數(shù)字人生產、內容創(chuàng)作、業(yè)務配置服務為一體的智能數(shù)字人平臺——“百度智能云曦靈”,基于人像驅動、智能對話、語音交互、智能推薦四大技術引擎,實現(xiàn)數(shù)字人的“能聽、能說、能理解、可互動”。同時,百度智能云曦靈提供便捷簡單的操作平臺,幫助企業(yè)低成本快速定制2D卡通、真人形象及3D卡通、超寫實數(shù)字人像,實現(xiàn)對話服務、內容創(chuàng)作全流程業(yè)務配置,極大降低數(shù)字人開發(fā)難度。
不久前,百度集團副總裁吳甜做客央視《對話》節(jié)目時提到,“百度希望通過領先的全棧AI能力,把虛擬人的生產周期縮短到小時級別,降低生產成本,并且用AI驅動生成內容。”
(百度智能云曦靈平臺架構圖)
例如,只要用戶在百度智能云曦靈平臺上傳一張照片,就能快速生成一個可被AI驅動的2D數(shù)字人像,原來生產流程需要一個星期做出來的2D數(shù)字人,現(xiàn)在可以縮短成半個小時。以前需要兩三個月時間做出來的3D數(shù)字人,現(xiàn)在可以壓縮到一兩周,同時數(shù)字人個性化功能開發(fā)也較之前更加完善,比如通過20句話的輕量化模型訓練,可生成數(shù)字人的聲音,即用戶說20句話即可生成屬于自己音色的數(shù)字人。
(數(shù)字人運營后臺圖)
目前,百度智能云曦靈已為廣電、互娛、金融、政務、運營商、零售等行業(yè)提供一站式的虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創(chuàng)建與運營服務。已落地的案例包括:浦發(fā)銀行理財專員數(shù)字人“小浦”、中國聯(lián)通數(shù)字人客服“小U”、百度APP代言人“龔俊數(shù)字人”、百度集團數(shù)字人“希加加”、火星車數(shù)字人“祝融號”等。
百度AI人機交互實驗室負責人李士巖表示:“我們近一兩年的奮斗目標是通過百度智能云曦靈平臺的開放,讓每個人、每一家企業(yè)實現(xiàn)數(shù)字人自由?!?/p>
(百度智能云曦靈數(shù)字人家族)
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 華為研發(fā)中心入駐上海青浦致小鎮(zhèn)房租大漲,帶動周邊租房市場熱潮
- 華為員工涌入蘇滬兩地,房東狂歡:租金幾近翻倍,跨省租房成新常態(tài)
- 制造業(yè)巨頭空客計劃裁員2500人,應對航天業(yè)務虧損與供應鏈挑戰(zhàn)
- 科技創(chuàng)新引領產業(yè)發(fā)展:江陰市與清華大學攜手推進重大科技項目
- 美國或再升級出口管制:考慮限制AI芯片對中東出口
- 劉強東章澤天報案:京東發(fā)言人證實夫婦倆遭有組織造謠,警方已介入
- 東方甄選擬15億出售教育業(yè)務
- 虧764億上熱搜 蔚來裁員10%,銷量跌出前三
- IBM設立5億元AI創(chuàng)投基金
- 聯(lián)想發(fā)布 ThinkStation P8工作站
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。