AI音樂創(chuàng)作、水墨畫、3D空間重建、6DoF,騰訊多媒體實驗室領先技術亮相數(shù)貿(mào)會

數(shù)字貿(mào)易,商通全球。近日,第二屆全球數(shù)字貿(mào)易博覽會在杭州開幕,為觀眾帶來數(shù)字貿(mào)易領域的新技術、新產(chǎn)品、新服務與新場景。今年,各類大模型如雨后春筍般涌現(xiàn),為解決產(chǎn)業(yè)痛點帶來了全新的思路。數(shù)貿(mào)會上,全球50個人工智能大模型集中亮相,成為最大的亮點之一。

騰訊多媒體實驗室的多項自研技術產(chǎn)品也亮相前沿趨勢館,帶領觀眾體驗AI作曲框架TXMusic、騰訊水墨畫、點云三維空間重建、6DoF沉浸式視頻等前沿技術產(chǎn)品,在感知技術進步中預見未來生活。

AI作曲框架XMusic由騰訊多媒體實驗室自研,曾被評為2023年世界人工智能大會“鎮(zhèn)館之寶”。XMusic支持視頻、圖片、文字、標簽、哼唱等多模態(tài)內(nèi)容作為輸入提示詞,生成情緒、曲風、節(jié)奏可控的高質(zhì)量音樂,大幅降低了音樂創(chuàng)作的門檻。

本次展會,XMusic團隊為現(xiàn)場觀眾帶來了最新的互動游戲。想體驗零門檻的AI音樂創(chuàng)作?想生成自己的樂器定制形象?多達12種古典和西洋樂器任你挑選,屏幕上動一動手指即可用喜歡的樂器參與AI音樂創(chuàng)作,還能和同時參與的小伙伴共創(chuàng)同一作品。線上的用戶也可以通過掃描下方小程序碼立即體驗音樂創(chuàng)作的樂趣。

“騰訊水墨畫”結(jié)合山水畫創(chuàng)作、智能作詩、智能配樂等多種自研能力,形成了多模態(tài)融合且能互動娛樂的完整解決方案,該產(chǎn)品由騰訊多媒體實驗室研發(fā),曾落地迪拜世博會,廣受好評。

基于騰訊多媒體實驗室的點云三維空間重建技術,能夠快速構建實景空間的數(shù)字孿生,即刻開啟沉浸式空間漫游與VR導覽。該方案已成功落地于文旅、會展等行業(yè)。比如成都世界大學生運動會,實驗室VR導覽方案覆蓋主場館、大運村等空間,全面提升參賽與觀賽體驗。

數(shù)字技術也不斷外溢,探索助力社會可持續(xù)發(fā)展。在文化領域,基于騰訊多媒體實驗室的快速點云編解碼器與渲染引擎,對甲骨文信息模型實現(xiàn)高質(zhì)量壓縮,顯著降低存儲與傳輸成本,在終端設備實現(xiàn)六自由度(6DoF)交互,全空間自由放大旋轉(zhuǎn),帶給用戶沉浸式視覺體驗,有效促進甲骨文的研究與體驗。

渲染引擎對于4K貼圖,渲染速度平均>=60fps,且支持8K超高清貼圖、PBR(基于物理的渲染)渲染方式,精細還原真實世界的材質(zhì)。使用騰訊多媒體實驗室的業(yè)界領先的支持最新一代視頻壓縮標準的Tencent266編解碼器,可以進一步降低傳輸帶寬的同時還能提升畫質(zhì)。

這些產(chǎn)品離不開實驗室的核心技術。新一代國際編解碼標準于20年7月正式發(fā)布,可在視頻主觀質(zhì)量不變的條件下減少50%的數(shù)據(jù)大小。騰訊多媒體實驗室正是這項標準制定的主要貢獻者之一,技術提案采納數(shù)量全球領先,實驗室專家們還在標準組織中擔任包括新一代國際編解碼標準聯(lián)合主編、參考軟件聯(lián)席主席等重要席位。

在MSU世界視頻編碼器大賽FullHD比賽中,騰訊自研最新一代視頻編碼器Tencent266取得了15項關鍵指標中12項第一,第一總數(shù)全場最多;并在全部VVC編碼器中包攬15項指標全部第一。此外Tencent266還在10bit/4K/主觀比賽中均取得了全場最多的第一總數(shù),證明Tencent266在不同應用場景下均能為用戶用更低的帶寬帶來更好的畫質(zhì)。

騰訊云已于21年7月全線支持新一代國際編解碼標準,這是該標準首次在云上商用,填補了全球云廠商在該領域的空白。Tencent266在23年初上線騰訊云直播,騰訊云成為行業(yè)首個支持VVC直播的云廠商。

騰訊多媒體實驗室代表騰訊參與多個國際及國家標準制定,包括H.266/VVC、MPEG-5 EVC、MPEG PCC、MPEG Systems、IETF、3GPP、國家標準AVS2 & AVS3、開放媒體聯(lián)盟(AOMedia) 標準AV2等,均取得了突破性成果,已有800+項技術提案被國際國家標準采納和1000+項已授權專利。實驗室專家數(shù)十人次擔任工作組/專題組聯(lián)合主席、標準聯(lián)合主編、董事等關鍵職務。同時,實驗室的研究員們在CVPR、ECCV等學術頂會和TCSVT等IEEE等專業(yè)期刊上發(fā)表了不少研究成果并獲得大量引用。

近年來,騰訊在前沿科技領域持續(xù)大力投入,布局以下一代互聯(lián)網(wǎng)為引領的數(shù)字科技,并以社會價值為牽引,讓科技在社會價值的大地上生根。

“騰訊多媒體實驗室將繼續(xù)推動多媒體及相關領域的國際和國家標準制定,打造音視頻、互動沉浸和智能媒體核心能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務平臺服務全球用戶、助力各行業(yè)發(fā)展并踐行科技向善。”騰訊云副總裁、騰訊多媒體實驗室負責人、騰訊杰出科學家劉杉博士表示。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )