快手出席中國多媒體大會:產學研合作共贏,迎接AGI時代新機遇

近日,中國多媒體大會(ChinaMM2023)在云南昆明召開,快手高級副總裁、研發(fā)線負責人于冰受邀在大會上發(fā)表了《AGI時代下智能媒體技術前沿進展與思考》主題演講,結合快手在多媒體技術領域內的創(chuàng)新實踐,分享快手的技術前沿進展及相關思考。

分階段探索業(yè)務發(fā)展策略,持續(xù)推進技術能效優(yōu)化

自2011年成立至今,快手已經發(fā)展成為國民級短視頻直播數字社區(qū),在用戶、內容、商業(yè)等方面保持良性增長態(tài)勢。而快手社區(qū)生態(tài)的蓬勃發(fā)展,離不開快手長期的巨大投入,以大規(guī)模自研技術支撐業(yè)務發(fā)展。

回顧快手過往經歷,于冰表示,業(yè)務發(fā)展會經歷入局、成長、成熟等多個階段,在業(yè)務發(fā)展的不同階段,快手所采取的研發(fā)策略也各有側重。創(chuàng)新成長期更注重持續(xù)投入,探索新產品、新周期;而成熟階段則需聚焦優(yōu)化效率,兼顧體驗,既保證產品體驗的競爭力,又保證業(yè)務的穩(wěn)健成長。

于冰以快手音視頻業(yè)務為例,目前該業(yè)務已步入成熟期,研發(fā)策略重點也轉移至提升效率、優(yōu)化成本,追求單位成本下算力、存儲和網絡使用效率的提升??焓只谧匝幸曨l質量評估KVQ、視頻增強修復KEP和KRP、視頻壓縮編碼算法KVC等一系列核心技術,形成數據驅動的視頻處理閉環(huán),在兼顧體驗的同時極致壓縮視頻。

2022年,快手技術toB業(yè)務StreamLake推出了首款自研智能視頻處理芯片SL200,該芯片集成了快手領先的視頻編解碼、圖像處理、AI推理、內容自適應編碼等關鍵技術,具備高質量、高密度、智能化的特點,在業(yè)內處于領先地位。在今年7月舉辦的MSU2022世界編碼器大賽中,SL200一舉奪得4K和1080P賽道24項指標中的16項第一。在本屆大會上,SL200也榮獲了中國多媒體企業(yè)創(chuàng)新技術獎。目前,SL200芯片已全面應用于快手的直播和短視頻業(yè)務,實現成熟技術通過StreamLake對產業(yè)賦能。

而在數字人領域,快手也取得了諸多領先成果。快手全鏈路自研了光場掃描重建、超寫實人像建模、智能綁定、動作捕捉與驅動、物理仿真等數字人核心技術,推出“快手虛擬演播助手(KVS)”和“快手智播”兩大解決方案;結合內容平臺在品牌營銷領域的獨特優(yōu)勢,在美術、技術、運營、營銷等多個維度賦能,打造了百萬粉絲虛擬主播關小芳、蒙牛集團首位虛擬員工奶思等多個知名IP。未來,結合智能編曲、圖像/視頻生成、LLM等AI能力,快手數字人技術將繼續(xù)在文旅、教育、游戲、直播電商等領域廣泛應用,助力客戶打造高品質低成本的3D和2D數字人。

深耕AI大模型領域,拓展產研學生態(tài)實現雙向賦能

隨著多媒體與AI技術的深度結合,快手持續(xù)深耕AI技術,推動產品形態(tài)、用戶體驗發(fā)展,探索短視頻業(yè)務的第二曲線。于冰認為,AI大模型作為當下最重要的革命性技術,進入爆發(fā)期,有望開啟AGI時代,而多模態(tài)內容生成與理解是其核心能力。

當前,多模態(tài)AI大模型因其在文本、代碼、圖像和視頻等多種內容上突出的生成與理解能力,有望為視頻生產、理解、分發(fā)、消費等全鏈路打開新的技術視角,突破傳統(tǒng)音視頻編碼的技術天花板,突破基于用戶行為的搜廣推算法的傳統(tǒng)思路,將視頻內容創(chuàng)作從PGC、UGC帶動進入AIGC時代,創(chuàng)造AI大模型驅動的視頻內容創(chuàng)作工具,激發(fā)創(chuàng)作者的創(chuàng)意空間,高效率、低成本地生產高質量的視頻內容。

而短視頻、直播作為最典型的多模態(tài)媒介,快手也抓住平臺基因,在AI大模型領域重度投入,全方位探索技術突破。于冰介紹,目前,快手在AI大模型的布局體系分為三個層級:基于具備高性能、高并發(fā)、高算力的“大基建”,構建快手多模態(tài)的AI“大模型”,進而在搜廣推、內容創(chuàng)作、用戶增長、研發(fā)效能等領域內打造“大應用”。

例如在搜廣推領域,快手搜廣推算法已達到國際領先水平,相關成果獲得信息檢索與數據挖掘領域國際頂級學術會議CIKM Best Paper、SIGIR Best Paper - Honorable Mention等榮譽,目前快手突破傳統(tǒng)基于用戶行為的技術思路,探索更深層次的模型網絡,開拓推薦模型,利用內容生成與理解來探索深層次用戶興趣的新路徑。

同時,在多模態(tài) AI大模型的加持下, AI技術和工具可全方位地賦能影視創(chuàng)作者,助其在創(chuàng)作、拍攝、后期等各階段激發(fā)創(chuàng)意、提升效率和內容質量,影視制作的周期也能大幅提高,過去花費數年拍攝的大片有望數月完成。

技術發(fā)展從萌芽到成熟,不僅僅靠企業(yè)自研,也需要高??蒲袡C構的人才賦能。此前,快手先后與清華大學、中國科學技術大學北京研究院、中國人民大學建立聯(lián)合科研機構,與全球頂尖高校、實驗室建立科研合作,共同探索音視頻、多媒體和AI領域的前沿技術,聯(lián)合培養(yǎng)科研人才。

“學術界有頂尖的技術和優(yōu)秀的科研人才,工業(yè)界則具備真實的應用場景,擁有海量數據和大算力的優(yōu)勢,兩者深度合作、雙向賦能,其價值將成倍放大。”于冰表示,一方面,技術的突破將在互聯(lián)網業(yè)務中得到規(guī)?;褂?,產生巨大的經濟效益和社會效益;另一方面,互聯(lián)網真實的場景、海量的數據、強大的算力,也能助力科研技術不斷迭代。未來,快手將持續(xù)促進產學研生態(tài)完善,向學術界開放場景、數據和算力,共同探索AGI時代智能媒體新技術,以技術賦能行業(yè)創(chuàng)新與發(fā)展。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )