RTE2023開幕 聲網(wǎng)宣布首創(chuàng)廣播級(jí)4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)

10月24日,由聲網(wǎng)和RTE開發(fā)者社區(qū)聯(lián)合主辦的RTE2023第九屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)在北京舉辦,聲網(wǎng)與眾多RTE領(lǐng)域技術(shù)專家、產(chǎn)品精英、創(chuàng)業(yè)者、開發(fā)者一起,共同開啟了以“智能·高清”為主題的全新探討。本屆RTE大會(huì)將持續(xù)2天,開展1場(chǎng)主論壇及20+專場(chǎng)活動(dòng),包括RTE領(lǐng)域技術(shù)開發(fā)、趨勢(shì)洞見、行業(yè)觀察、創(chuàng)業(yè)投資等多維度內(nèi)容分享,覆蓋了AIGC、出海、數(shù)字化轉(zhuǎn)型等時(shí)下最熱門的話題。

1.jpg

在24日主論壇上,聲網(wǎng)創(chuàng)始人兼CEO趙斌、聲網(wǎng)合伙人兼客戶成功副總裁孫雨潤(rùn)帶來了《智能·高清 開啟實(shí)時(shí)互動(dòng)體驗(yàn)新時(shí)代》的主旨演講。Founders Space創(chuàng)始人兼CEO 史蒂夫?霍夫曼 (Steve Hoffman)從國(guó)際投資人視角,洞察了AI賦能RTE未來的諸多可能性。聲網(wǎng)首席科學(xué)家、CTO鐘聲聚焦AI時(shí)代實(shí)時(shí)互動(dòng)的趨勢(shì),帶來了最前沿的技術(shù)觀點(diǎn)和解讀。聯(lián)合國(guó)人口基金(UNFPA)駐華代表處副代表兼負(fù)責(zé)人歐雯姍(Ira Ovesen)則從“科技無國(guó)界”的角度,介紹了實(shí)時(shí)互動(dòng)技術(shù)為世界帶來的改變。

此外,聲網(wǎng)首席運(yùn)營(yíng)官劉斌、喜馬拉雅首席科學(xué)家盧恒、Soul APP技術(shù)副總裁張高政、小紅書音視頻架構(gòu)負(fù)責(zé)人陳靖、商湯科技商務(wù)總監(jiān) 數(shù)字文娛事業(yè)部副總裁李星冶,還以”AI如何賦能實(shí)時(shí)互動(dòng)體驗(yàn)改善及場(chǎng)景升級(jí)“為主題進(jìn)行了圓桌討論。

智能·高清 開啟實(shí)時(shí)互動(dòng)體驗(yàn)新時(shí)代

回顧2023年,AIGC大模型驅(qū)動(dòng)著各行業(yè)迎來新業(yè)務(wù)機(jī)會(huì),AR、VR、XR等技術(shù)能力的迭代為實(shí)時(shí)互動(dòng)在各個(gè)領(lǐng)域的應(yīng)用提供了更多可能。在直播社交領(lǐng)域,彈幕玩法成為直播新風(fēng)口,這些變化都影響著RTE行業(yè)的進(jìn)化。

智能和高清正在推動(dòng)實(shí)時(shí)互動(dòng)體驗(yàn)進(jìn)入全新時(shí)代,在大會(huì)開場(chǎng)演講中,趙斌宣布:“聲網(wǎng)在RTE行業(yè)首次實(shí)現(xiàn)廣播級(jí)4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)?!彼赋?, “4K不僅僅只有分辨率一個(gè)緯度,光亮強(qiáng)度的動(dòng)態(tài)范圍、色彩的真實(shí)度、飽和度,以及色彩漸變的細(xì)膩程度,都是真正超高清體驗(yàn)里不可或缺的一環(huán)?!睆V播級(jí)超高清可以帶來更加逼真的視覺效果,高對(duì)比度和豐富的色彩表現(xiàn)可以使影像更加生動(dòng),細(xì)節(jié)更加清晰,并以此提升觀影體驗(yàn)。

image004.jpg

趙斌認(rèn)為,虛擬人+AIGC所創(chuàng)造的情感和情緒價(jià)值或?qū)⒃谖磥斫鉀Q社交供需不平衡的現(xiàn)狀,并引領(lǐng)交互對(duì)象發(fā)生變化。另一層面,隨著AIGC能力的進(jìn)一步加強(qiáng),越來越多的應(yīng)用型開發(fā)將被AIGC替代,API+AI的形式將大幅提高應(yīng)用開發(fā)效率。

大模型在快速發(fā)展,但交互界面仍局限于文字聊天互動(dòng)方式。趙斌提到,通過過去一年的投入和打磨,聲網(wǎng)推出行業(yè)首創(chuàng)AIGC-RTC能力模塊,可支持與任何大模型平臺(tái)結(jié)合,實(shí)現(xiàn)更低延時(shí)、更自然、更沉浸的實(shí)時(shí)語(yǔ)音對(duì)話,為企業(yè)協(xié)作、社交 、直播、游戲等多種場(chǎng)景提供新玩法、新機(jī)會(huì)。

在AI等核心技術(shù)驅(qū)動(dòng)下,實(shí)時(shí)互動(dòng)QoE體驗(yàn)的變化對(duì)于用戶留存和使用行為的影響日益增強(qiáng)。孫雨潤(rùn)介紹,“根據(jù)聲網(wǎng)某東南亞頭部泛娛樂客戶數(shù)據(jù)顯示,當(dāng)視頻從標(biāo)清升級(jí)高清,停留超過30秒觀眾數(shù)提升19%,觀眾人均觀看時(shí)長(zhǎng)提升30%,同時(shí)觀眾打賞率大幅提升。某國(guó)內(nèi)知名社交出海App,從CDN 升級(jí)聲網(wǎng)極速直播,送禮率增長(zhǎng) 12.3%。”

image006.jpg

AI如何賦能RTE未來

AIGC被認(rèn)為是當(dāng)前的技術(shù)革命,它與RTE的深度結(jié)合,又將帶來什么改變呢?Founders Space創(chuàng)始人兼CEO 史蒂夫?霍夫曼在分享中指出:“人工智能將對(duì)許多領(lǐng)域產(chǎn)生影響,在AI賦能的RTE未來,我們將看到每個(gè)人都會(huì)擁有更加個(gè)性化的體驗(yàn),更加動(dòng)態(tài)的程序?qū)㈦S著圖形、音頻、視頻的實(shí)時(shí)變化而變化,AI將為我們帶來前所未有的連接方式。在更深層次上,AI還將為人類增加更多的生產(chǎn)力水平,帶來動(dòng)態(tài)的虛擬世界等等,讓我們感受到更多的沉浸體驗(yàn)?!?/p>

image008.jpg

史蒂夫?霍夫曼表示:“在AI和RTE技術(shù)的加持下,新的穿戴設(shè)備可能會(huì)進(jìn)入市場(chǎng),比如新的皮膚電子設(shè)備、感官增強(qiáng)設(shè)備等,它可以讓我們聽到人類聽力范圍之外的頻率。此外,腦機(jī)接口也將讀取我們的腦電波,從而幫助我們實(shí)現(xiàn)冥想或?qū)ζ渌O(shè)備的控制。”在工業(yè)RTE場(chǎng)景應(yīng)用下,人們可以聚在一起,實(shí)時(shí)通過虛擬或真實(shí)工廠觀看流水線運(yùn)作、產(chǎn)品生產(chǎn)等。在AI陪伴場(chǎng)景中,人工智能伴侶這一概念將成為人們社交生活、娛樂、事業(yè)的一部分。

綜上,未來可能會(huì)有各種類型的伴侶應(yīng)用以及新的實(shí)時(shí)接口方式出現(xiàn),甚至?xí)霈F(xiàn)一套為RTE開發(fā)的全新硬件,這些都將極大改變RTE領(lǐng)域的發(fā)展前景。

AI時(shí)代 實(shí)時(shí)互動(dòng)何去何從

AI時(shí)代已經(jīng)來臨,實(shí)時(shí)互動(dòng)該何去何從?聲網(wǎng)首席科學(xué)家、CTO鐘聲為我們帶來了技術(shù)視角的深度分享。鐘聲指出,回溯過去五年,最典型的事件就是大模型的突破,從2017年的Transformer,到如今的ChatGPT-4,人工智能的發(fā)展,讓信息傳播和消費(fèi)智能化的趨勢(shì)越來越明顯,萬事歸于中心化AGI接管的趨勢(shì)和威脅也越來越明顯。大模型在帶來發(fā)展機(jī)遇的同時(shí),也帶來了計(jì)算需求快速增長(zhǎng)、算力受能源供給力限制、大模型數(shù)據(jù)資源不夠、存儲(chǔ)需求增長(zhǎng)過快等問題。未來,我們除了要做負(fù)責(zé)任的AI之外,在端上和邊緣上的分布式實(shí)時(shí)智能將成為價(jià)值公平分配的重要技術(shù)手段,也是減緩中心化AGI對(duì)人類威脅的有效途徑,這也注定會(huì)成為一個(gè)新的技術(shù)發(fā)展趨勢(shì)。

鐘聲認(rèn)為,AGI將走進(jìn)實(shí)時(shí)互動(dòng),實(shí)現(xiàn)人人可分身,幫助在應(yīng)用場(chǎng)景中復(fù)制名師、網(wǎng)紅,甚至普通人也將通過AI分身豐富體驗(yàn)、緩解時(shí)間稀缺的瓶頸。。此外,他預(yù)測(cè),具備端邊實(shí)時(shí)智能的高清實(shí)時(shí)互動(dòng)能力將成新趨勢(shì)和競(jìng)爭(zhēng)焦點(diǎn)。

鐘聲介紹到,實(shí)時(shí)高清需要許多端上實(shí)時(shí)AI,在Low Level Vision and Audio這一需求層面,聲網(wǎng)的SDK 4.1.x, 4.2.x版本已經(jīng)可以支持1080P/4K視頻的例如超分、虛擬背景、感知編碼、降噪、去回聲等底層計(jì)算機(jī)視覺處理和高音質(zhì)的計(jì)算機(jī)聽覺處理能力。在High Level Vision and Audio層面,聲網(wǎng)已經(jīng)部分實(shí)現(xiàn)對(duì)物體、聲音、場(chǎng)景的理解和重構(gòu)能力,包括面捕、動(dòng)捕、情感計(jì)算,物體識(shí)別和場(chǎng)景重建等,可以大力改善多種應(yīng)用場(chǎng)景下的用戶體驗(yàn)。

科技賦能:共筑數(shù)字包容未來

在一個(gè)科技無國(guó)界的世界里,人工智能、實(shí)時(shí)互動(dòng)技術(shù)、生物技術(shù)、材料科學(xué)等技術(shù)創(chuàng)新力量構(gòu)建了一個(gè)“數(shù)字包容”的世界。過去一年,聯(lián)合國(guó)人口基金與聲網(wǎng)通過實(shí)時(shí)互動(dòng)技術(shù),為中國(guó)偏遠(yuǎn)地區(qū)的一萬多名青少年提供了適齡的健康教育。聯(lián)合國(guó)人口基金(UNFPA)駐華代表處副代表兼負(fù)責(zé)人歐雯姍表示,“人工智能和實(shí)時(shí)互動(dòng)技術(shù)為那些仍在使用型號(hào)較老的多媒體設(shè)備的學(xué)校提供了量身定制的解決方案。它不僅優(yōu)化了直播流的分辨率,還增強(qiáng)了在教學(xué)和學(xué)習(xí)過程中的音視頻質(zhì)量。學(xué)生和直播教師可以實(shí)現(xiàn)像傳統(tǒng)課堂那樣身臨其境的教學(xué)質(zhì)量和速度?!?/p>

image010.jpg

同時(shí),歐雯姍宣布,聯(lián)合國(guó)人口基金駐華代表處與聲網(wǎng)及其他合作伙伴聯(lián)合發(fā)起了“智享銀齡”科技助老青年創(chuàng)新挑戰(zhàn)賽。她表示,“我們希望激發(fā)青年人,特別是大學(xué)生和年輕畢業(yè)生,為代際數(shù)字包容貢獻(xiàn)想法并做出積極行動(dòng)?!?/p>

圓桌:AI如何賦能實(shí)時(shí)互動(dòng)體驗(yàn)改善及場(chǎng)景升級(jí)?

AI技術(shù)的發(fā)展為各行各業(yè)帶來了用戶體驗(yàn)改善和場(chǎng)景玩法創(chuàng)新。針對(duì)這一話題,喜馬拉雅首席科學(xué)家盧恒、Soul APP技術(shù)副總裁張高政、小紅書音視頻架構(gòu)負(fù)責(zé)人陳靖、商湯科技商務(wù)總監(jiān) 數(shù)字文娛事業(yè)部副總裁李星冶、聲網(wǎng)首席運(yùn)營(yíng)官劉斌進(jìn)行了圓桌討論。

談到AI技術(shù)對(duì)業(yè)務(wù)發(fā)展的影響時(shí),盧恒表示,作為全國(guó)最大的有聲內(nèi)容平臺(tái),喜馬拉雅從文本處理到音頻內(nèi)容生成的過程中都使用了大量的AI技術(shù),目前,AIGC生成的音頻內(nèi)容日均播放量已超過250萬小時(shí)。張高政則表示,大模型的理解能力對(duì)于UGC平臺(tái)及用戶來說都非常有利,它不僅可以快速提升內(nèi)容生產(chǎn)效率,還能降低內(nèi)容生產(chǎn)門檻。

image012.jpg

AI大模型的發(fā)展是機(jī)遇與挑戰(zhàn)并存的。陳靖指出,對(duì)于很多公司而言,說清楚一些AI大模型項(xiàng)目的必要性是一個(gè)巨大挑戰(zhàn),很多項(xiàng)目并不像利用AI去做體驗(yàn)增強(qiáng)那樣,能夠跟用戶留存及轉(zhuǎn)化的一些指標(biāo)建立關(guān)聯(lián)。李星冶則表示,他所看到的挑戰(zhàn)有兩點(diǎn)。其一,在為許多C端流量產(chǎn)品提供服務(wù)時(shí),算力、帶寬、智力相關(guān)的彈性儲(chǔ)備是一個(gè)很現(xiàn)實(shí)的挑戰(zhàn),其二,大模型開發(fā)廠商如何平衡投入以及預(yù)期收入之間的關(guān)系,也是一個(gè)挑戰(zhàn)。各位嘉賓還分享了AI大模型在實(shí)時(shí)互動(dòng)領(lǐng)域的一些玩法創(chuàng)新,其中陳靖提到,提高主播觀看率的美顏美體功能可能是過去AI為實(shí)時(shí)互動(dòng)領(lǐng)域貢獻(xiàn)最大價(jià)值的場(chǎng)景,希望今后會(huì)看到更多新的嘗試。

如劉斌所總結(jié)的,無論未來是挑戰(zhàn)還是機(jī)遇,我們都應(yīng)該在各自行業(yè)里去努力嘗試。我們也期待,在大模型新的范式發(fā)展下,看到越來越多的場(chǎng)景落地及業(yè)務(wù)價(jià)值。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-10-25
RTE2023開幕 聲網(wǎng)宣布首創(chuàng)廣播級(jí)4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)
?10月24日,由聲網(wǎng)和RTE開發(fā)者社區(qū)聯(lián)合主辦的RTE2023第九屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)在北京舉辦,聲網(wǎng)與眾多RTE領(lǐng)域技術(shù)專家、產(chǎn)品精英、創(chuàng)業(yè)者、開發(fā)者一起,共同開啟了以“智能·高清”為主題的全新探討。

長(zhǎng)按掃碼 閱讀全文