撰文 |?龍 曦
題圖 | 騰訊音樂(lè)
在這個(gè)群“?!眮y舞的時(shí)代,有人提出,所有的互聯(lián)網(wǎng)業(yè)務(wù),都可以用大模型再做一遍。
話雖如此,但大模型真正落地的要素,卻相當(dāng)難以具備。如果說(shuō)傳統(tǒng)意義上的“算法、算力和數(shù)據(jù)”是AI的基本要素,那么“高質(zhì)量數(shù)據(jù)+高層次人才+高頻場(chǎng)景”的“三高要素”,才是催生大模型、特別是行業(yè)大模型的關(guān)鍵。
從這個(gè)角度去看,騰訊音樂(lè)娛樂(lè)集團(tuán)(下稱“騰訊音樂(lè)”)正在構(gòu)建和完善自己的“三高要素”,以組建屬于音樂(lè)產(chǎn)業(yè)的大模型。事實(shí)上,這家領(lǐng)先的中國(guó)在線音樂(lè)與音頻娛樂(lè)平臺(tái)已經(jīng)廣泛的在業(yè)務(wù)中使用AI技術(shù),這次財(cái)報(bào)披露的信息也顯示,在較短時(shí)間內(nèi),這家企業(yè)已基于數(shù)據(jù)和場(chǎng)景方面的優(yōu)勢(shì),在大模型賽道的產(chǎn)業(yè)化應(yīng)用方面探索出了一條有差異化競(jìng)爭(zhēng)力的新路。
一、音樂(lè)擁抱大模型:騰訊音樂(lè)的產(chǎn)業(yè)AIGC落地探索
生成式大模型ChatGPT引發(fā)的全球群“?!眮y舞,使得AIGC(人工智能原創(chuàng)內(nèi)容)備受關(guān)注。
事實(shí)上,除了強(qiáng)大的文本能力之外,圖像、音樂(lè)乃至一切可以用數(shù)字形式承載的“內(nèi)容”,都可以用大模型的方式進(jìn)行生成,所以在當(dāng)下,多模態(tài)大模型也成為一個(gè)備受關(guān)注的方向。
由于世界上已經(jīng)有很多開源大模型、開源數(shù)據(jù)集作為基礎(chǔ),所以,僅僅就做出一個(gè)大模型本身而言,只要具有足夠的資金和人才資源,想要達(dá)到一定的參數(shù)量,并不是多么困難的事。這也是很多新創(chuàng)團(tuán)隊(duì)在很短的時(shí)間內(nèi)就宣布自己推出生成式大模型的深層原因。
但用錢解決不了的問(wèn)題是,如果不能具備實(shí)際的落地場(chǎng)景和商業(yè)價(jià)值,大模型本身并不能產(chǎn)生價(jià)值,只能成為成本。
所以,要判斷大模型能否落地,先要看看這一領(lǐng)域內(nèi)是否已經(jīng)有足夠的AI實(shí)踐。
從這個(gè)角度看過(guò)去,騰訊音樂(lè)在AIGC方面,已經(jīng)有了諸多方面的領(lǐng)先嘗試。例如其最新一季財(cái)報(bào)中,就提到了其正在持續(xù)探索大語(yǔ)言模型(LLMs)在AIGC領(lǐng)域落地的多元應(yīng)用,推出的“TME Studio音樂(lè)創(chuàng)作助手”與“音色制作人”不僅協(xié)助音樂(lè)人在作詞、作曲、音樂(lè)內(nèi)容分析與剪輯等制作環(huán)節(jié)的效率提升,還可將用戶原聲與不同歌曲無(wú)縫融合,促進(jìn)高質(zhì)量?jī)?nèi)容的創(chuàng)作。甚至其財(cái)報(bào)視頻中的音樂(lè),也由騰訊音樂(lè)領(lǐng)先的音頻大模型協(xié)助創(chuàng)作完成。
有實(shí)踐就更容易用好大模型,本質(zhì)上,是因?yàn)榇竽P鸵彩茿I的一種,也遵循AI落地的基本規(guī)律。所以,如果一個(gè)企業(yè)以前一點(diǎn)使用AI的積累都沒(méi)有,憑空宣布自己要深度切入大模型領(lǐng)域,大概率是為了講故事和畫餅充饑。
而騰訊音樂(lè),在有諸多AI實(shí)踐經(jīng)驗(yàn)和場(chǎng)景、數(shù)據(jù)積累方面,都有充分的準(zhǔn)備,這意味它的大模型之路,已然會(huì)平坦許多。
二、騰訊音樂(lè)產(chǎn)業(yè)大模型:基于行業(yè)需求的生產(chǎn)力布局
目前大模型的通用玩法有兩種,第一是自建千億級(jí)乃至萬(wàn)億級(jí)的通用大模型,另一個(gè)是利用已有通用大模型的能力,做產(chǎn)業(yè)級(jí)大模型。
但是,無(wú)論如何,都有三個(gè)痛點(diǎn)不能忽視。
首先,需要有清晰的應(yīng)用落點(diǎn),而且要和大模型的能力匹配。
騰訊音樂(lè)的業(yè)務(wù)焦點(diǎn)就是音樂(lè)等內(nèi)容和音效、直播等音視頻技術(shù),再加上其在用戶側(cè)的應(yīng)用、互動(dòng)、參與,這是突出且明確的剛需。所以從這個(gè)角度說(shuō),需求足夠明確,就有清晰的應(yīng)用落點(diǎn)。
其次,是有足夠規(guī)模的預(yù)訓(xùn)練數(shù)據(jù)集。
即使有了深度學(xué)習(xí)技術(shù)的加持,但經(jīng)過(guò)人工精標(biāo)的大規(guī)模訓(xùn)練數(shù)據(jù)集,仍然是生成式模型的關(guān)鍵。
目前比較通行的行業(yè)說(shuō)法是,一個(gè)產(chǎn)業(yè)級(jí)(賽道級(jí),而非通用級(jí))大模型,至少需要500GB以上精標(biāo)的數(shù)據(jù),或者至少2500億字的高質(zhì)量?jī)?nèi)容。
而騰訊音樂(lè)的其中一個(gè)核心優(yōu)勢(shì)在于,其本身就具有大量的數(shù)字化內(nèi)容。
例如,隨著多元化音效成為用戶音樂(lè)消費(fèi)的“剛需”。第一季度,騰訊音樂(lè)將高品質(zhì)音質(zhì)進(jìn)一步覆蓋至車載場(chǎng)景,其旗下QQ音樂(lè)的銀河音效可實(shí)現(xiàn)車載音響的最佳效果。酷狗音樂(lè)的蝰蛇音效也在滿足方便使用、好聽好玩的基礎(chǔ)功能之上,持續(xù)深耕,讓音效服務(wù)在聽感提升的同時(shí),不斷更新各類玩法,以開放平臺(tái)打造UGC音效社區(qū),成為國(guó)內(nèi)首屈一指的音效品牌。
這里的重點(diǎn)是“UGC”。我們可以理解為,12萬(wàn)條以上的音效中有相當(dāng)部分,是用戶參與構(gòu)建或打磨的,而這種“打磨”某種程度上就可以視為一種“數(shù)據(jù)標(biāo)注”,這都是騰訊音樂(lè)可以復(fù)用的優(yōu)質(zhì)數(shù)據(jù)資源。
而隨著智能化輔助創(chuàng)作工具――騰訊音樂(lè)旗下TME Studio等全新創(chuàng)作工具的推出,使得大批音樂(lè)人加入、使用,驅(qū)使這部分?jǐn)?shù)據(jù)的質(zhì)量也在不斷提升,使得騰訊音樂(lè)的大模型有了充足的數(shù)據(jù)燃料。
最后,大模型落地還需要企業(yè)有足夠的垂直領(lǐng)域的數(shù)字化能力,這對(duì)于數(shù)字原生的騰訊音樂(lè)來(lái)說(shuō)是一個(gè)天然利好,而很多傳統(tǒng)產(chǎn)業(yè)要邁過(guò)這一關(guān),則并不容易。
因此,行業(yè)都在大膽猜測(cè),騰訊音樂(lè)未來(lái)的大模型,將是在騰訊集團(tuán)的通用大模型的基礎(chǔ)上,結(jié)合特定需求和專有數(shù)據(jù)集訓(xùn)練生產(chǎn)的行業(yè)多模態(tài)大模型。
其中,第一個(gè)問(wèn)題很好解決,真正的超大規(guī)模的通用大模型(AGC)需要1萬(wàn)張算力卡以上和近乎黑洞般的數(shù)據(jù),能具備這個(gè)條件的企業(yè)不多,騰訊肯定是其中一個(gè);
其次,騰訊音樂(lè)不需要從底座就開始做,而應(yīng)該是基于前者做私有化部署,并且結(jié)合垂直領(lǐng)域的數(shù)據(jù)和知識(shí)“微調(diào)”自己的個(gè)性化模型。
這其中的道理,就像用電一樣,雖然家家都需要,但不需要家家都有發(fā)電廠。對(duì)于騰訊,通用大模型一個(gè)就夠了,用各個(gè)業(yè)務(wù)群組自己的數(shù)據(jù)做私有化部署和做個(gè)性化微調(diào)是最佳的解決方案。
最后一個(gè)推測(cè)是,這個(gè)過(guò)程將很快推進(jìn)到實(shí)用階段。因?yàn)椋?strong>騰訊音樂(lè)的AI落地場(chǎng)景很多,對(duì)大模型有切實(shí)的需求,所以很快就能用起來(lái)并產(chǎn)生商業(yè)和社會(huì)價(jià)值。大模型對(duì)于騰訊音樂(lè)不是噱頭、不是妝點(diǎn),而是實(shí)實(shí)在在的生產(chǎn)力。
三、產(chǎn)業(yè)未來(lái)應(yīng)用落地:技術(shù)即內(nèi)容生產(chǎn)力
據(jù)了解,在ChatGPT出來(lái)之前,騰訊音樂(lè)就已經(jīng)在使用百億參數(shù)的大語(yǔ)言模型。
從結(jié)果上看,確實(shí)落地也很快,這些嘗試也讓騰訊音樂(lè)頗具行業(yè)前瞻性地在產(chǎn)業(yè)級(jí)大模型的訓(xùn)練和部署上積累了豐富的經(jīng)驗(yàn)。
那么,產(chǎn)業(yè)級(jí)多模態(tài)大模型在騰訊音樂(lè)體系內(nèi)的應(yīng)用,結(jié)合其現(xiàn)有業(yè)務(wù)來(lái)看會(huì)如何落地和輸出價(jià)值呢?
在內(nèi)容創(chuàng)作方向,騰訊音樂(lè)此前已經(jīng)了推出的面向音樂(lè)人的智能化輔助創(chuàng)作工具――TME Studio,除了集合了QQ音樂(lè)銀河音效、MUSE引擎、TME天琴實(shí)驗(yàn)室等各方面的技術(shù)外,騰訊AI Lab作為騰訊內(nèi)部最重要的AI團(tuán)隊(duì),也對(duì)其提供了強(qiáng)有力的AI技術(shù)支持。
而旗下酷狗的“音色制作人”,其技術(shù)本質(zhì),是通過(guò)深度學(xué)習(xí)原理,可以通過(guò)學(xué)習(xí)人的聲音,經(jīng)過(guò)AI智能化處理后生成專屬的音色音效,并以此來(lái)制作歌曲。
這些工具都極大的降低了音樂(lè)創(chuàng)作的門檻,其中,TME Studio中的可分離提取歌曲中的人聲和樂(lè)器的“音樂(lè)分離”、基于音樂(lè)內(nèi)容理解識(shí)別各式歌曲要素的“MIR計(jì)算”等功能;以及音色制作人中的全新上線AI封面、AI寫真、AI幫唱、AI詞曲評(píng)估以及AI覓詞等五大功能,都實(shí)現(xiàn)了以科技來(lái)改變過(guò)去音樂(lè)制作存在的“不可能三角”——質(zhì)量、速度、成本,令其能夠同時(shí)實(shí)現(xiàn)。
它們的價(jià)值體現(xiàn)在,對(duì)C端來(lái)說(shuō),從單純的音樂(lè)欣賞(單向傳播)變成了UGC、PUGC參與的可共創(chuàng)、可交互的系統(tǒng),使得各種體驗(yàn)和玩法得到極大的提升;從B端來(lái)說(shuō),由于用戶的廣泛參與,和未來(lái)生成能力的增強(qiáng),將從根本上改變音樂(lè)行業(yè)的成本機(jī)構(gòu),而成本結(jié)構(gòu)的改變是一切深層次產(chǎn)業(yè)變革的基礎(chǔ)。
“目前,中國(guó)已躍升成為全球第五大音樂(lè)市場(chǎng)。這意味著產(chǎn)業(yè)從業(yè)者們通過(guò)長(zhǎng)期更耕耘,正在持續(xù)推動(dòng)著中華文化影響力的持續(xù)提升。而技術(shù)的進(jìn)步,則能為音樂(lè)產(chǎn)業(yè)在數(shù)字化時(shí)代的發(fā)展提供更加夯實(shí)的基礎(chǔ)和更高的生產(chǎn)效率?!皩?duì)于AIGC等前沿技術(shù)在音樂(lè)產(chǎn)業(yè)內(nèi)的應(yīng)用和發(fā)展趨勢(shì),騰訊音樂(lè)娛樂(lè)集團(tuán)QQ音樂(lè)技術(shù)副總裁、天琴實(shí)驗(yàn)室負(fù)責(zé)人周文江表示,基于對(duì)行業(yè)發(fā)展痛點(diǎn)和用戶體驗(yàn)需求的深度洞察,TME在前幾年已率先組建天琴實(shí)驗(yàn)室等業(yè)內(nèi)頂尖的技術(shù)研究團(tuán)隊(duì),各團(tuán)隊(duì)技術(shù)人才結(jié)構(gòu)和部分研究成果已達(dá)到行業(yè)領(lǐng)先水平,目前也正在持續(xù)推動(dòng)文本、圖像、音視頻等多個(gè)維度的AIGC創(chuàng)新成果落地,“在為行業(yè)提供更全面的數(shù)據(jù)支撐的同時(shí),也希望能為音樂(lè)產(chǎn)業(yè)的數(shù)字化升級(jí)和高質(zhì)量發(fā)展注入新的活力?!?/p>
當(dāng)音樂(lè)遇上AIGC,用技術(shù)為文化創(chuàng)造更多價(jià)值的未來(lái)已經(jīng)近在眼前。毫無(wú)疑問(wèn)的是,大模型的賦能,將使得騰訊音樂(lè)把技術(shù)轉(zhuǎn)化為實(shí)實(shí)在在的生產(chǎn)力,能夠?yàn)樾袠I(yè)提供更多服務(wù)、為用戶提供革命性體驗(yàn),最終雙向奔赴,進(jìn)而為行業(yè)創(chuàng)造更多增量,推動(dòng)自身和行業(yè)的高質(zhì)量增長(zhǎng),也為我們的精神生活增添更多的樂(lè)趣。
- 特斯拉市值一夜蒸發(fā)超6400億元,美股科技“七巨頭”陷入調(diào)整區(qū)間
- 阿里巴巴于上海新設(shè)智信普惠科技公司,布局多領(lǐng)域技術(shù)服務(wù)
- 馬化騰短暫登頂中國(guó)富豪榜,騰訊科技與股價(jià)雙輪驅(qū)動(dòng)成關(guān)鍵
- 本地生活賽道:2025年紅海變“血?!?,平臺(tái)競(jìng)逐白熱化
- 義烏哪吒小商品熱賣:緊跟《哪吒2》熱潮,一天賣幾百套
- 美恢復(fù)接收中國(guó)包裹,貿(mào)易政策突變引發(fā)物流界震蕩
- DeepSeek或再掀波瀾,可能對(duì)美股市場(chǎng)造成新一輪打擊
- 谷歌股價(jià)暴跌:收入增長(zhǎng)放緩,人工智能支出引投資者擔(dān)憂
- 華為去年銷售收入超8600億元:ICT基礎(chǔ)設(shè)施穩(wěn)健,新業(yè)務(wù)快速發(fā)展
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。