制造“空間魔術(shù)”:為未來(lái)取暖的騰訊多媒體實(shí)驗(yàn)室

對(duì)80、90后包括00后來(lái)說(shuō),人生中很多“見證奇跡的時(shí)刻”,都是與騰訊旗下一款款國(guó)民級(jí)產(chǎn)品共同度過(guò)的。比如第一次向千里之外的網(wǎng)友發(fā)出那句“你好嗎”,感受到了天涯若比鄰的真正含義;又像是第一次用微視拍一條小視頻,看到貼圖與自己的臉龐完美貼合,體會(huì)到數(shù)字世界與現(xiàn)實(shí)世界是怎樣連接的奇妙。

技術(shù)之于現(xiàn)實(shí)世界魔術(shù)一般的驚人改變,很多時(shí)候都是這樣,以一款產(chǎn)品為契機(jī),去改變一個(gè)用戶、一個(gè)群體乃至一代人的生活。

而魔術(shù)制造者從不休息。2019年12月25日,云視頻會(huì)議產(chǎn)品“騰訊會(huì)議”正式發(fā)布,在背后為其提供支持的便是神秘的騰訊多媒體實(shí)驗(yàn)室。

今天我們不妨從“騰訊會(huì)議”的魔術(shù)出發(fā),去探尋其背后的魔術(shù)工廠。

遠(yuǎn)程會(huì)議:移動(dòng)辦公的最大短板

說(shuō)起遠(yuǎn)程會(huì)議,估計(jì)我們的各位“社畜”讀者已經(jīng)非常熟悉了。在分布式辦公、移動(dòng)辦公非常普遍的今天,隨時(shí)打開微信群語(yǔ)音交流工作,或是開啟QQ群視頻來(lái)一場(chǎng)遠(yuǎn)程會(huì)議,都是很普遍的事。

但遠(yuǎn)程會(huì)議的體驗(yàn),過(guò)去是大家有目共睹的差——通話延遲十分常見,更讓人煩惱的是如果誰(shuí)所處的環(huán)境有噪聲,便會(huì)影響所有人的體驗(yàn)。尤其很多筆記本電腦的收音設(shè)備都距離鍵盤很近,在做會(huì)議記錄時(shí),往往需要暫時(shí)關(guān)閉麥克風(fēng)才能保持不打擾他人。像挪動(dòng)水杯、一兩聲咳嗽這樣在面對(duì)面會(huì)議中很常見情況,在遠(yuǎn)程通話中都會(huì)變成干擾會(huì)議的噪音。更別提視頻會(huì)議時(shí),直面攝像頭的尷尬了。

而這種情況并非無(wú)法解決。很多軟硬件廠商也會(huì)選擇用降噪算法、壓縮算法等方式來(lái)優(yōu)化網(wǎng)絡(luò)通話體驗(yàn)。但在會(huì)議場(chǎng)景中,卻很難找到相對(duì)理想的統(tǒng)一解決方案。尤其從鍵盤打字這種近音干擾噪音如何優(yōu)化,到多人通話的低時(shí)延保持,再到視頻流與音頻流結(jié)合的優(yōu)化,往往都是移動(dòng)會(huì)議場(chǎng)景才會(huì)面對(duì)問題。如果沒有針對(duì)性的解決措施,用戶很難找到替代方案。

而騰訊會(huì)議這款產(chǎn)品,就是針對(duì)這一場(chǎng)景的驚人“空間魔術(shù)”。

空間魔術(shù):騰訊多媒體實(shí)驗(yàn)室如何把同事“變”到你身邊?

騰訊會(huì)議的魔術(shù)可以被分為四個(gè)部分:音畫、聯(lián)通、評(píng)估與網(wǎng)絡(luò)。

在音畫方面,騰訊多媒體實(shí)驗(yàn)室不僅提供了視頻美顏算法,還特地收錄了車站噪聲、風(fēng)雨噪聲等常見的環(huán)境噪聲,以及咳嗽聲、鍵盤聲、放水杯聲等常見的會(huì)議噪聲。通過(guò)定點(diǎn)降噪處理,剝離噪音還原清晰人聲。同時(shí)騰訊多媒體實(shí)驗(yàn)室還打通了VoIP、PSTN等多種語(yǔ)音通話技術(shù),在盡可能廣泛的帶寬和采樣率中應(yīng)用音頻超分算法,通過(guò)技術(shù)處理提升語(yǔ)音品質(zhì)。不僅如此,多媒體實(shí)驗(yàn)室還推出了真實(shí)網(wǎng)絡(luò)場(chǎng)景的語(yǔ)音質(zhì)量運(yùn)維和保障方案。在提供良好的通話效果之外,也通過(guò)這一方案幫助用戶更好地對(duì)雜音、噪音進(jìn)行定位,為通話效果提供保障。

在音畫能力和聯(lián)通能力背后,重要的支撐力就是評(píng)估能力。大多數(shù)時(shí)候遠(yuǎn)程會(huì)議通話的清晰與否,都只能由用戶自己主觀判斷。這對(duì)會(huì)議通話的產(chǎn)業(yè)化發(fā)展是非常不利的。而騰訊多媒體實(shí)驗(yàn)室則擁有專業(yè)的音視頻實(shí)驗(yàn)室和測(cè)試設(shè)備,利用上百個(gè)符合ITU/3GPP/AVS等國(guó)內(nèi)外標(biāo)準(zhǔn)的指標(biāo)對(duì)通話質(zhì)量進(jìn)行評(píng)估。多媒體實(shí)驗(yàn)室自己也建立了大規(guī)模音視頻主觀質(zhì)量數(shù)據(jù)庫(kù),在此基礎(chǔ)之上研發(fā)了可以部署到業(yè)務(wù)線中的評(píng)估算法。這樣一來(lái)不僅在研發(fā)時(shí)可以有衡量標(biāo)準(zhǔn),也可以監(jiān)控用戶的體驗(yàn)質(zhì)量。最后,針對(duì)多方通話可能面對(duì)的各方網(wǎng)絡(luò)連接狀態(tài)不同的情況,騰訊多媒體實(shí)驗(yàn)室還應(yīng)用了智能網(wǎng)絡(luò)探測(cè)算法,覆蓋多種網(wǎng)絡(luò)類型,在復(fù)雜的網(wǎng)絡(luò)環(huán)境之下提供優(yōu)質(zhì)的通話服務(wù)。

除此之外,騰訊會(huì)議還提供一鍵錄音、云端加密存儲(chǔ)等功能,讓產(chǎn)品形態(tài)更加完整,囊括會(huì)議進(jìn)行和會(huì)議記錄保存的整個(gè)周期。

如此一來(lái),即使身處嘈雜的街邊,用戶也能享受到如同身處封閉會(huì)議間式的通話體驗(yàn)??萍季腿缤兡g(shù)一般,讓身處天涯海角的人們?cè)谕弧翱臻g”內(nèi)無(wú)礙溝通。

魔術(shù)師的進(jìn)階之路

從反復(fù)出現(xiàn)的名字就能看到,在空間魔術(shù)背后提供動(dòng)能的“魔術(shù)師”,就是騰訊多媒體實(shí)驗(yàn)室。雖然這一名字較為新鮮,但騰訊多媒體實(shí)驗(yàn)室的魔術(shù)師進(jìn)階之路,卻從多年前就開始了。

想想開頭提到的,很多人小時(shí)候第一次“見證奇跡的時(shí)刻”就是通過(guò)QQ與遠(yuǎn)方的親人朋友聊天。但很快這種溝通模式就從文字進(jìn)化成了語(yǔ)音和視頻,也就是說(shuō),從很久以前,騰訊就已經(jīng)在處理語(yǔ)音視頻會(huì)話的技術(shù)問題了。

到了2011年左右,當(dāng)移動(dòng)端產(chǎn)品逐漸普及,QQ語(yǔ)音通話這一體驗(yàn)和電話通話十分接近的功能迎來(lái)了更廣闊的需求。于是QQ成立了音視頻中心,開始著手解決語(yǔ)音視頻功能移動(dòng)化的問題。尤其是弱網(wǎng)的適應(yīng)性、以及移動(dòng)終端的豐富類型,都是在提供優(yōu)質(zhì)影音服務(wù)之前,必須要解決的問題。

從這一時(shí)刻起,騰訊多媒體實(shí)驗(yàn)室的技術(shù)基地開始加速累積。但也正因一開始為解決QQ產(chǎn)品需求而生,使得騰訊多媒體實(shí)驗(yàn)室的技術(shù)與QQ業(yè)務(wù)深度耦合。但到了2014年,隨著硬件能力的提升和普及,語(yǔ)音視頻服務(wù)開始出現(xiàn)在更多的產(chǎn)品之中——K歌、直播、游戲……尤其像直播、K歌等源自模式創(chuàng)新且注重運(yùn)營(yíng)的產(chǎn)品,往往都是業(yè)務(wù)比技術(shù)優(yōu)化更先上馬。此時(shí)這些產(chǎn)品所向往的,正是已經(jīng)在應(yīng)用場(chǎng)景取得成果并且能夠盡快與自身業(yè)務(wù)場(chǎng)景結(jié)合的技術(shù)。騰訊自己也通過(guò)布局投資和成立新業(yè)務(wù)開始涉足這些領(lǐng)域,此時(shí)急需的,是技術(shù)與產(chǎn)品之間的解耦,完善SDK使技術(shù)可以復(fù)用,在更廣泛的空間中發(fā)揮價(jià)值。

于是在2016年騰訊音視頻實(shí)驗(yàn)室正式獨(dú)立,最終成長(zhǎng)為今天我們所看到的騰訊多媒體實(shí)驗(yàn)室。從最初的成員數(shù)只有個(gè)位數(shù),到現(xiàn)在全球超過(guò)100多人的團(tuán)隊(duì),強(qiáng)大的人才儲(chǔ)備結(jié)合接近二十年的累積,還有無(wú)數(shù)次來(lái)自真實(shí)場(chǎng)景的技術(shù)煉金,一切都為這位魔術(shù)師累積了充足的工具箱。

從魔術(shù)師,到制造魔術(shù)的工廠

從騰訊會(huì)議這一款產(chǎn)品中,我們也能窺見一二。

除了能夠提供聲音降噪、音頻超分等語(yǔ)音方面的算法之外,在騰訊會(huì)議這款產(chǎn)品中還能見到騰訊多媒體實(shí)驗(yàn)室強(qiáng)大的編解碼能力。

例如在遠(yuǎn)程會(huì)議常見的屏幕分享場(chǎng)景中,常常會(huì)出現(xiàn)畫面卡頓、文字等細(xì)節(jié)內(nèi)容模糊的情況。騰訊多媒體實(shí)驗(yàn)室針對(duì)屏幕分享場(chǎng)景做了大量?jī)?yōu)化。在編碼方面推出了專門針對(duì)屏幕內(nèi)容的屏幕內(nèi)容編碼器TSE,并在其中加入屏幕內(nèi)容編碼工具,以提升編碼效率。至于文字模糊問題,騰訊多媒體實(shí)驗(yàn)室則采用了YUV444編碼,很好地解決了因?yàn)樯确至肯虏蓸訉?dǎo)致的質(zhì)量損失。

在實(shí)時(shí)音視頻能力上,騰訊實(shí)驗(yàn)室除了有豐富的場(chǎng)景經(jīng)驗(yàn)外,還對(duì)于業(yè)界先進(jìn)的學(xué)術(shù)成果保持持續(xù)追蹤,就像在擁塞控制這一常見需求上,騰訊實(shí)驗(yàn)室就調(diào)研了各種學(xué)術(shù)界和業(yè)界最新的擁塞控制算法,結(jié)合自身累積的場(chǎng)景經(jīng)驗(yàn),提出了新的實(shí)時(shí)擁塞控制算法,在不同網(wǎng)絡(luò)場(chǎng)景下都能迅速給出可靠的帶寬預(yù)測(cè),以便運(yùn)營(yíng)方即時(shí)做出各種準(zhǔn)備。

不僅如此,騰訊多媒體實(shí)驗(yàn)室還在音視頻質(zhì)量評(píng)估、互動(dòng)沉浸式媒體方面有著強(qiáng)大的累積。能夠?qū)崿F(xiàn)端到端的音視頻內(nèi)容質(zhì)量評(píng)估的客觀音視頻質(zhì)量評(píng)估算法,以及全新的互動(dòng)式媒體交互手段,都是騰訊多媒體實(shí)驗(yàn)室已經(jīng)開始向產(chǎn)業(yè)世界所輸出的能力。

魔術(shù)師的帽子里,有抽不盡的彩帶、飛翔的白鴿和跳躍的兔子。一切都是為讓整個(gè)世界增添更多魔法色彩而服務(wù)。但一位魔術(shù)師,所面對(duì)往往只是一群人、一個(gè)劇場(chǎng)、一條街道。

在這里,我們就可以重新審視騰訊多媒體實(shí)驗(yàn)室的布局與籌劃。

騰訊強(qiáng)大的產(chǎn)品基因,以及優(yōu)圖、AI Lab、安全實(shí)驗(yàn)室等其他部門提供的豐富技術(shù)能力,最后加上騰訊云這一輸出口,可以讓騰訊多媒體實(shí)驗(yàn)室的技術(shù)擁有更妥帖的落地能力。目前除了在騰訊會(huì)議中外,全民K歌、斗魚直播、NOW直播等產(chǎn)品中,也能見到騰訊多媒體實(shí)驗(yàn)室所釋放的“空間魔術(shù)”。在接受采訪時(shí),騰訊多媒體實(shí)驗(yàn)室相關(guān)負(fù)責(zé)人也表示,未來(lái)騰訊多媒體實(shí)驗(yàn)室的技術(shù),將會(huì)盡可能地開放給社會(huì),讓更多產(chǎn)業(yè)參與者能夠在此基礎(chǔ)之上優(yōu)化自身產(chǎn)品。

這樣看來(lái),與其說(shuō)騰訊多媒體實(shí)驗(yàn)室是某一項(xiàng)產(chǎn)品背后的魔術(shù)師,不如說(shuō)這是一座“魔術(shù)工廠”,不僅用一只帽子里的兔子驚艷他人,而是源源不斷批量生產(chǎn)“魔法”,讓世界與狀態(tài)理想接軌——讓更流暢無(wú)卡頓的直播,拉近陌生人之間的距離?;蚴且皇谉o(wú)縫銜接的遠(yuǎn)程合唱,讓遠(yuǎn)在天邊的家人也能感受到一起K歌的快樂。

對(duì)于成長(zhǎng)于互聯(lián)網(wǎng)和公寓樓中的千禧一代來(lái)說(shuō),遷徙、分離、孤獨(dú)似乎成了他們生活的常態(tài)。但一款能讓他們隨時(shí)聯(lián)系到家人朋友的通訊軟件,一種能讓他們相隔千里也有對(duì)坐而談感受的技術(shù),幾乎是生活的必需品。用技術(shù)消弭物理空間的阻隔,是這場(chǎng)空間魔術(shù)的最大魅力,也是騰訊一直在做的。而這一魔術(shù)顯然不會(huì)僅僅被騰訊擁有,而是通過(guò)云端撒向世界,如同一場(chǎng)溫暖的雪,為即將到來(lái)的未來(lái)取暖。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-01-13
制造“空間魔術(shù)”:為未來(lái)取暖的騰訊多媒體實(shí)驗(yàn)室
尤其從鍵盤打字這種近音干擾噪音如何優(yōu)化,到多人通話的低時(shí)延保持,再到視頻流與音頻流結(jié)合的優(yōu)化,往往都是移動(dòng)會(huì)議場(chǎng)景才會(huì)面對(duì)問題。

長(zhǎng)按掃碼 閱讀全文