騰訊音樂財報,當音樂遇上AIGC

撰文 |?龍 曦

題圖 | 騰訊音樂

在這個群“?!眮y舞的時代,有人提出,所有的互聯網業(yè)務,都可以用大模型再做一遍。

話雖如此,但大模型真正落地的要素,卻相當難以具備。如果說傳統意義上的“算法、算力和數據”是AI的基本要素,那么“高質量數據+高層次人才+高頻場景”的“三高要素”,才是催生大模型、特別是行業(yè)大模型的關鍵。

從這個角度去看,騰訊音樂娛樂集團(下稱“騰訊音樂”)正在構建和完善自己的“三高要素”,以組建屬于音樂產業(yè)的大模型。事實上,這家領先的中國在線音樂與音頻娛樂平臺已經廣泛的在業(yè)務中使用AI技術,這次財報披露的信息也顯示,在較短時間內,這家企業(yè)已基于數據和場景方面的優(yōu)勢,在大模型賽道的產業(yè)化應用方面探索出了一條有差異化競爭力的新路。

一、音樂擁抱大模型:騰訊音樂的產業(yè)AIGC落地探索

生成式大模型ChatGPT引發(fā)的全球群“?!眮y舞,使得AIGC(人工智能原創(chuàng)內容)備受關注。

事實上,除了強大的文本能力之外,圖像、音樂乃至一切可以用數字形式承載的“內容”,都可以用大模型的方式進行生成,所以在當下,多模態(tài)大模型也成為一個備受關注的方向。

由于世界上已經有很多開源大模型、開源數據集作為基礎,所以,僅僅就做出一個大模型本身而言,只要具有足夠的資金和人才資源,想要達到一定的參數量,并不是多么困難的事。這也是很多新創(chuàng)團隊在很短的時間內就宣布自己推出生成式大模型的深層原因。

但用錢解決不了的問題是,如果不能具備實際的落地場景和商業(yè)價值,大模型本身并不能產生價值,只能成為成本。

所以,要判斷大模型能否落地,先要看看這一領域內是否已經有足夠的AI實踐。

從這個角度看過去,騰訊音樂在AIGC方面,已經有了諸多方面的領先嘗試。例如其最新一季財報中,就提到了其正在持續(xù)探索大語言模型(LLMs)在AIGC領域落地的多元應用,推出的“TME Studio音樂創(chuàng)作助手”與“音色制作人”不僅協助音樂人在作詞、作曲、音樂內容分析與剪輯等制作環(huán)節(jié)的效率提升,還可將用戶原聲與不同歌曲無縫融合,促進高質量內容的創(chuàng)作。甚至其財報視頻中的音樂,也由騰訊音樂領先的音頻大模型協助創(chuàng)作完成。

有實踐就更容易用好大模型,本質上,是因為大模型也是AI的一種,也遵循AI落地的基本規(guī)律。所以,如果一個企業(yè)以前一點使用AI的積累都沒有,憑空宣布自己要深度切入大模型領域,大概率是為了講故事和畫餅充饑。

騰訊音樂,在有諸多AI實踐經驗和場景、數據積累方面,都有充分的準備,這意味它的大模型之路,已然會平坦許多。

二、騰訊音樂產業(yè)大模型:基于行業(yè)需求的生產力布局

目前大模型的通用玩法有兩種,第一是自建千億級乃至萬億級的通用大模型,另一個是利用已有通用大模型的能力,做產業(yè)級大模型。

但是,無論如何,都有三個痛點不能忽視。

首先,需要有清晰的應用落點,而且要和大模型的能力匹配。

騰訊音樂的業(yè)務焦點就是音樂等內容和音效、直播等音視頻技術,再加上其在用戶側的應用、互動、參與,這是突出且明確的剛需。所以從這個角度說,需求足夠明確,就有清晰的應用落點。

其次,是有足夠規(guī)模的預訓練數據集。

即使有了深度學習技術的加持,但經過人工精標的大規(guī)模訓練數據集,仍然是生成式模型的關鍵。

目前比較通行的行業(yè)說法是,一個產業(yè)級(賽道級,而非通用級)大模型,至少需要500GB以上精標的數據,或者至少2500億字的高質量內容。

而騰訊音樂的其中一個核心優(yōu)勢在于,其本身就具有大量的數字化內容。

例如,隨著多元化音效成為用戶音樂消費的“剛需”。第一季度,騰訊音樂將高品質音質進一步覆蓋至車載場景,其旗下QQ音樂的銀河音效可實現車載音響的最佳效果??峁芬魳返尿裆咭粜б苍跐M足方便使用、好聽好玩的基礎功能之上,持續(xù)深耕,讓音效服務在聽感提升的同時,不斷更新各類玩法,以開放平臺打造UGC音效社區(qū),成為國內首屈一指的音效品牌。

這里的重點是“UGC”。我們可以理解為,12萬條以上的音效中有相當部分,是用戶參與構建或打磨的,而這種“打磨”某種程度上就可以視為一種“數據標注”,這都是騰訊音樂可以復用的優(yōu)質數據資源。

而隨著智能化輔助創(chuàng)作工具――騰訊音樂旗下TME Studio等全新創(chuàng)作工具的推出,使得大批音樂人加入、使用,驅使這部分數據的質量也在不斷提升,使得騰訊音樂的大模型有了充足的數據燃料。

最后,大模型落地還需要企業(yè)有足夠的垂直領域的數字化能力,這對于數字原生的騰訊音樂來說是一個天然利好,而很多傳統產業(yè)要邁過這一關,則并不容易。

因此,行業(yè)都在大膽猜測,騰訊音樂未來的大模型,將是在騰訊集團的通用大模型的基礎上,結合特定需求和專有數據集訓練生產的行業(yè)多模態(tài)大模型。

其中,第一個問題很好解決,真正的超大規(guī)模的通用大模型(AGC)需要1萬張算力卡以上和近乎黑洞般的數據,能具備這個條件的企業(yè)不多,騰訊肯定是其中一個;

其次,騰訊音樂不需要從底座就開始做,而應該是基于前者做私有化部署,并且結合垂直領域的數據和知識“微調”自己的個性化模型。

這其中的道理,就像用電一樣,雖然家家都需要,但不需要家家都有發(fā)電廠。對于騰訊,通用大模型一個就夠了,用各個業(yè)務群組自己的數據做私有化部署和做個性化微調是最佳的解決方案。

最后一個推測是,這個過程將很快推進到實用階段。因為,騰訊音樂的AI落地場景很多,對大模型有切實的需求,所以很快就能用起來并產生商業(yè)和社會價值。大模型對于騰訊音樂不是噱頭、不是妝點,而是實實在在的生產力。

三、產業(yè)未來應用落地:技術即內容生產力

據了解,在ChatGPT出來之前,騰訊音樂就已經在使用百億參數的大語言模型。

從結果上看,確實落地也很快,這些嘗試也讓騰訊音樂頗具行業(yè)前瞻性地在產業(yè)級大模型的訓練和部署上積累了豐富的經驗。

那么,產業(yè)級多模態(tài)大模型在騰訊音樂體系內的應用,結合其現有業(yè)務來看會如何落地和輸出價值呢?

在內容創(chuàng)作方向,騰訊音樂此前已經了推出的面向音樂人的智能化輔助創(chuàng)作工具――TME Studio,除了集合了QQ音樂銀河音效、MUSE引擎、TME天琴實驗室等各方面的技術外,騰訊AI Lab作為騰訊內部最重要的AI團隊,也對其提供了強有力的AI技術支持。

而旗下酷狗的“音色制作人”,其技術本質,是通過深度學習原理,可以通過學習人的聲音,經過AI智能化處理后生成專屬的音色音效,并以此來制作歌曲。

這些工具都極大的降低了音樂創(chuàng)作的門檻,其中,TME Studio中的可分離提取歌曲中的人聲和樂器的“音樂分離”、基于音樂內容理解識別各式歌曲要素的“MIR計算”等功能;以及音色制作人中的全新上線AI封面、AI寫真、AI幫唱、AI詞曲評估以及AI覓詞等五大功能,都實現了以科技來改變過去音樂制作存在的“不可能三角”——質量、速度、成本,令其能夠同時實現。

它們的價值體現在,對C端來說,從單純的音樂欣賞(單向傳播)變成了UGC、PUGC參與的可共創(chuàng)、可交互的系統,使得各種體驗和玩法得到極大的提升;從B端來說,由于用戶的廣泛參與,和未來生成能力的增強,將從根本上改變音樂行業(yè)的成本機構,而成本結構的改變是一切深層次產業(yè)變革的基礎。

“目前,中國已躍升成為全球第五大音樂市場。這意味著產業(yè)從業(yè)者們通過長期更耕耘,正在持續(xù)推動著中華文化影響力的持續(xù)提升。而技術的進步,則能為音樂產業(yè)在數字化時代的發(fā)展提供更加夯實的基礎和更高的生產效率?!皩τ?a href="http://m.ygpos.cn/AIGC_1.html" target="_blank" class="keylink">AIGC等前沿技術在音樂產業(yè)內的應用和發(fā)展趨勢,騰訊音樂娛樂集團QQ音樂技術副總裁、天琴實驗室負責人周文江表示,基于對行業(yè)發(fā)展痛點和用戶體驗需求的深度洞察,TME在前幾年已率先組建天琴實驗室等業(yè)內頂尖的技術研究團隊,各團隊技術人才結構和部分研究成果已達到行業(yè)領先水平,目前也正在持續(xù)推動文本、圖像、音視頻等多個維度的AIGC創(chuàng)新成果落地,“在為行業(yè)提供更全面的數據支撐的同時,也希望能為音樂產業(yè)的數字化升級和高質量發(fā)展注入新的活力。”

當音樂遇上AIGC,用技術為文化創(chuàng)造更多價值的未來已經近在眼前。毫無疑問的是,大模型的賦能,將使得騰訊音樂把技術轉化為實實在在的生產力,能夠為行業(yè)提供更多服務、為用戶提供革命性體驗,最終雙向奔赴,進而為行業(yè)創(chuàng)造更多增量,推動自身和行業(yè)的高質量增長,也為我們的精神生活增添更多的樂趣。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2023-05-16
騰訊音樂財報,當音樂遇上AIGC
用技術為文化創(chuàng)造更多價值的未來已經近在眼前。

長按掃碼 閱讀全文