自研大模型、打造“智能體”,vivo打開敘事新空間

(高靖宇/文)近年來手機產(chǎn)業(yè)發(fā)展進入創(chuàng)新期,手機廠商正試圖尋找新的差異化出路。特別今年以來,隨著ChatGPT的橫空出世和全民級應(yīng)用發(fā)展趨勢,眾多手機廠商紛紛入局AI大模型賽道,成為當(dāng)下最火熱的技術(shù)賽道。

而在這場大模型競賽中,vivo顯然走在了前列。11月1日,在2023 vivo開發(fā)者大會上,vivo正式發(fā)布自研藍心大模型BlueLM、OriginOS 4、自研藍河操作系統(tǒng)BlueOS。其中,藍心大模型是vivo自研通用大模型矩陣,從開源到完全自研歷時6年,包括十億、百億、千億三個不同參數(shù)量級的5款自研大模型,全面覆蓋核心應(yīng)用場景,并將大模型矩陣能力全面融入到OriginOS 4。這意味著,vivo端側(cè)大模型已從前沿技術(shù)探索進入到應(yīng)用和產(chǎn)業(yè)級落地新階段。

大模型與手機結(jié)合之后,智能手機又有了新敘事,為未來智能手機發(fā)展探索出新方向。vivo副總裁、OS產(chǎn)品副總裁周圍預(yù)判,未來手機的發(fā)展趨勢或?qū)⑦M化為“智能體”。

如何將大模型裝入手機?答案是:端云協(xié)同

通過類似ChatGPT、文心一言的APP就能使用大模型,為什么還要把大模型裝入到手機端側(cè)呢?這是因為,與單純在云端部署生成式 AI 應(yīng)用和服務(wù)相比,手機終端側(cè)部署生成式 AI 可以實現(xiàn)在設(shè)備端運行復(fù)雜的AI算法,從而減少對云端服務(wù)的依賴,個人私密信息也不用上傳的云端,保障數(shù)據(jù)安全。此外,手機可以更好地理解和響應(yīng)用戶的需求,從而滿足用戶對更加智能化手機的期待。

那么,大模型千億級的參數(shù)量如何在手機上流程運行,此時端云協(xié)同的混合架構(gòu)就成為關(guān)鍵。vivo的藍心大模型包含有10億、70億、700億、1300億、1750億五種參數(shù)規(guī)模,其中10億量級模型是主要面向端側(cè)場景打造的專業(yè)文本大模型,具備本地化的文本總結(jié)、摘要等能力。70億模型是面向手機打造的端云兩用模型,具有優(yōu)秀的語言理解、文本創(chuàng)作能力,同時,上述兩個量級的模型支持高通和MTK最新旗艦雙平臺端側(cè)化部署,在保證數(shù)據(jù)安全的同時,在出詞速度、響應(yīng)時間、內(nèi)存占用等方面也非常優(yōu)秀,實現(xiàn)了安全與性能的雙重并舉。

vivo同時在做的有10億、70億、700億、1300億、1750億五種參數(shù)規(guī)模的藍心大模型,其中10億和70億已經(jīng)可以由本地算力支撐,而更大的數(shù)據(jù)仍然需要運行在云端。為此,vivo并不會強制用戶必須使用端側(cè)或者云端,而是交給用戶自己去選擇,比如隱私保密性不需要那么高的輸入法等功能,可以選擇在云端運行,而公司文件、相冊等,就可以利用手機本身的算力來完成。

700億模型是面向云端服務(wù)的主力模型,其綜合能力,在C-Eval、CMMLU、SuperCLUE(10月)等榜單中均處于中文大模型的第一梯隊。另外1300億、1750億模型也將在更復(fù)雜的場景中以更豐富的知識和推理能力為用戶帶來更專業(yè)的智能體驗。

除了與云端協(xié)作,手機大模型還面臨算法和算力的挑戰(zhàn)。vivo整個團隊花了六年多時間不斷解決問題,在算法方面,在預(yù)訓(xùn)練階段,vivo利用最前沿的Transformer架構(gòu),改良了注意力機制、位置編碼等關(guān)鍵模塊,并在包含了3.3萬億詞的大規(guī)模多語言數(shù)據(jù)集上進行訓(xùn)練,最終使得藍心大模型具備了超強的基礎(chǔ)能力。算力上,vivo也在積極通過信息技術(shù)應(yīng)用創(chuàng)新去解決算力問題,組建了一只150人的工程團隊,持續(xù)地提升集群的效率,目前vivo千億模型訓(xùn)練周期低于2個月,百億模型不到2周。

目前,vivo構(gòu)建了超過100萬條高質(zhì)量的多語言多任務(wù)指令數(shù)據(jù)進行學(xué)習(xí)和訓(xùn)練,從而讓藍心大模型更好地理解用戶的意圖,適應(yīng)各種目標(biāo)任務(wù)。并在安全部署中通過了中國信通院內(nèi)容審核服務(wù)系統(tǒng)評測,在文本、語音和視頻內(nèi)容識別需要檢測的15個大類中,14個大類獲得最高的5星等級,1個獲得4星等級。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-11-03
自研大模型、打造“智能體”,vivo打開敘事新空間
近年來手機產(chǎn)業(yè)發(fā)展進入創(chuàng)新期,手機廠商正試圖尋找新的差異化出路。特別今年以來,隨著ChatGPT的橫空出世和全民級應(yīng)用發(fā)展趨勢,眾多手機廠商紛紛入局AI大模型賽

長按掃碼 閱讀全文