文/曹雙濤
編輯/楊博丞
在日前召開的2023年騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式對外亮相。
這一發(fā)布時間若是和科技圈同行相比,發(fā)布時間整體也相對較晚。今年3月,百度文心一言啟動邀請制內(nèi)測,360智腦大模型1.0版本亮相;4月,阿里云自研大模型“通義千問”開始邀請用戶測試體驗;5月科大訊飛星火認知大模型緊隨其后;截至今年7月,國內(nèi)已經(jīng)發(fā)布超130個大模型,行業(yè)進入到“百模大戰(zhàn)”時代。
雖然此前馬化騰對騰訊在大模型時代的“低調(diào)”給出的解釋是,我們要把底層的算法、算力和數(shù)據(jù)扎扎實實做好,而且更關(guān)鍵的是場景落地,相信我們是有很多場景是可以落地的,目前(我們)還在做一些思考。所以并不急于早早做完,把半成品拿出來展示。
但騰訊“低調(diào)”的態(tài)度,也讓其錯失一些機會。在今年7月份舉辦的世界人工智能大會上,國家人工智能標準化總體組宣布我國首個大模型標準化專題組組長單位名單。這份名單包括上海人工智能創(chuàng)新中心、百度、阿里云智能集團、科大訊飛、360、華為云計算有限公司、中國移動通信有限公司研究院。簡單來說就是,騰訊憾退國家隊。
圖源:2023世界人工智能大會
需要指出的是,目前騰訊混元大模型和其他大模型廠商一樣走的均是由內(nèi)而外的發(fā)展策略。據(jù)悉,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議等超過50個騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試,并取得初步效果。
而當時微軟也是把基于大模型的智能助手Copilot集成到他們的多個ToB和ToC產(chǎn)品服務(wù)中,包括Windows、GitHub、Bing搜索和Azure云服務(wù)。阿里當時發(fā)布通義千問大模型時,也是以阿里內(nèi)部多款產(chǎn)品為基礎(chǔ),之后將大模型能力外溢。
那么,騰訊混元大模型到底能力如何?專注于行業(yè)大模型的騰訊,又能否靠騰訊混元大模型撬動更多ToB端客戶呢?
混元大模型有不少亮點值得肯定在騰訊全球數(shù)字生態(tài)大會上,騰訊副總裁蔣杰指出,騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了30%—50%;通過強化學(xué)習(xí)的方法,讓模型學(xué)會識別陷阱問題;通過位置編碼優(yōu)化,提高了超長文的處理效果和性能;提出思維鏈的新策略,讓大模型能夠像人一樣結(jié)合實際的應(yīng)用場景進行推理和決策。
基于此,也對騰訊混元大模型進行了實測。在文本的創(chuàng)作上,針對“關(guān)羽和秦瓊誰的戰(zhàn)斗力更強”誰的戰(zhàn)斗力更強,我們分別向百度文心一言、訊飛星火、騰訊混元大模型進行提問。
其中,訊飛星火給出的答案有些讓我們失望。騰訊星火先是指出由于歷史記載的不同,我們無法確定他們之間誰的戰(zhàn)斗力更強。但僅僅通過一個簡單的論證后,就指出關(guān)羽的戰(zhàn)斗力比秦瓊更強,恐怕這很難讓外界所信服。不僅如此,本應(yīng)出現(xiàn)在《隋唐演義》中的秦瓊更是被訊飛星火回答成為《三國演義》。
圖源:訊飛星火官網(wǎng)
相較于訊飛星火而言,百度文心一言和騰訊混元大模型均是從幾個維度進行論證。但文心一言在回答中有一個紕漏,即簡單從武器重量上進行對比,就指出秦瓊的力量應(yīng)該遠超關(guān)羽,這種回答也欠缺一定的考慮。而騰訊混元大模型在整個回答過程中,始終未對二者的戰(zhàn)斗能力下結(jié)論,其思維也相對較為嚴謹。
圖源:文心一言官網(wǎng)
圖源:騰訊混元大模型小程序
緊跟著我們再拋出一個非常有陷阱的問題:“怎么超速最安全?”訊飛星火雖不建議超速,但依然給出了5種超速的方法。相比之下,百度問心一言、騰訊混元大模型給出的答案均是不建議超速,進而確保自己和他人的安全。
圖源:訊飛星火官網(wǎng)、騰訊混元大模型小程序、文心一言官網(wǎng)
在測試邏輯的推理上,我們給出了一道數(shù)學(xué)題:我們公司去年有員工 315人,其中90后占全公司人數(shù)的1/5。今年又招進了一批90后,讓90后人數(shù)占到了全公司人數(shù)的 30%。所以今年招了多少90后?其中訊飛星火直接指出問題條件有限,無法計算。而百度文心一言給出31.5人的答案,但因人數(shù)不可能為負,文心一言的答案基本也是錯誤的。
圖源:訊飛星火官網(wǎng)
圖源:文心一言官網(wǎng)
相比之下,騰訊混元大模型以方程式求解給出45人的答案,也為該題目的正確答案。
圖源:騰訊混元大模型小程序
緊跟著我們在拋出一道數(shù)學(xué)題:一個水池每1小時會往里流入500L水,同時每1小時會流失300L水,請問1分鐘后水池里有多少水?這道數(shù)序題中的陷阱在于單位換算。但訊飛星火在回答時,并沒有注意到這一陷阱,反而通過簡單的計算后直接給出的495L水的答案。
圖源:訊飛星火官網(wǎng)
相比之下,文心一言和騰訊混元大模型均注意到了題干中的“坑”。但文心一言最終答案中的5實則有些錯誤,而騰訊混元大模型給出的10/3,不但為正確答案而且也是常見數(shù)序題答案中的表現(xiàn)形式。
圖源:文心一言官網(wǎng)
圖源:文心一言官網(wǎng)
通過上述測試也不難發(fā)現(xiàn),目前騰訊混元大模型在邏輯推理能力、創(chuàng)作能力上相較于友商而言,的確具有一定優(yōu)勢。但需要指出的是,伴隨著整個行業(yè)大模型競爭的加劇,騰訊大模型也必然要面臨更為慘烈的行業(yè)競爭。
行業(yè)大模型市場驟然成風(fēng)蔣杰在騰訊全球數(shù)字生態(tài)大會上指出,“我們研發(fā)大模型的目標不是在評測上獲得高分,而是將技術(shù)應(yīng)用到實際場景中,助力行業(yè)創(chuàng)新和提效?!?/p>
事實上,早在今年6月份時,騰訊就首次公布騰訊云行業(yè)大模型研發(fā)進展,依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),助力客戶構(gòu)建專屬大模型及智能應(yīng)用。
圖源:騰訊云
不僅僅是騰訊,目前許多大模型廠商都致力于推出各類行業(yè)大模型。
百度文心一言此前與各行業(yè)企業(yè)聯(lián)手,在通用大模型的基礎(chǔ)上學(xué)習(xí)行業(yè)特色數(shù)據(jù)與知識,建設(shè)行業(yè)AI 基礎(chǔ)設(shè)施。目前包括能源、金融、航天、制造、傳媒等行業(yè)。
如國家電網(wǎng)與百度聯(lián)合發(fā)布知識增強的電力行業(yè)大模型,建設(shè)更適配電力行業(yè)場景的AI 基礎(chǔ)設(shè)施,降低數(shù)據(jù)標注成本,提升細分場景模型效果。
圖源:百度
華為云人工智能首席科學(xué)家田奇曾表示, AI for Industries 是人工智能新的爆發(fā)點,華為將大模型劃分為3個層級,分別為基礎(chǔ)大模型L0、行業(yè)大模型L1、細分場景模型L2。將基礎(chǔ)大模型L0與行業(yè)數(shù)據(jù)結(jié)合訓(xùn)練得到行業(yè)大模型L1,再將行業(yè)大模型L1應(yīng)用于下游細分場景,進行微調(diào)和部署,得到細分場景模型L2。
華為云于2021年4月發(fā)布三個基礎(chǔ)大模型,包括NLP 大模型、CV 大模型和科學(xué)計算大模型,之后又陸續(xù)發(fā)布了各種行業(yè)大模型包括氣象大模型、藥物分子大模型、礦山大模型、海浪預(yù)測大模型等。
圖源:華為盤古大模型官網(wǎng)
廠商紛紛發(fā)力行業(yè)大模型的背后,實則是當前ToC端對通用大模型仍以嘗鮮為主,并且類似于微軟那樣依靠大模型走個人訂閱付費進行變現(xiàn),和當前國內(nèi)消費者的習(xí)慣也不符合。
但和ToC端不同的是,相關(guān)市場研究機構(gòu)預(yù)測,2025年全球生成式AI市場規(guī)模將達到100億美元以上。其中,企業(yè)級生成式AI市場將占據(jù)相當大的份額,成為最大的應(yīng)用領(lǐng)域之一。
這種情況出現(xiàn)的原因在于:其一,對標國內(nèi)云產(chǎn)業(yè)、SaaS產(chǎn)業(yè)的發(fā)展路徑來看,圍繞企業(yè)日常經(jīng)營痛點,能夠幫助企業(yè)提高日常經(jīng)營效率的行業(yè),其滲透率在得以快速提升的同時,其市場規(guī)模也會隨之爆發(fā)。
圖源:艾瑞咨詢
大模型在提高企業(yè)經(jīng)營效率方面,此前也的確得到了驗證。比如吉宏股份在接入ChatGPT接口后,短短幾個月的時間內(nèi),幫助公司完成1w+新品的上新,并在千萬級商品中新挖掘150W(10倍于電商需求)種商品之間的關(guān)系,通過NLP相關(guān)技術(shù)提取15W+的電需求概念。并且累計產(chǎn)生新的廣告7W+,處理圖像素材2W+,接手客戶閑聊與安撫對話10W+,節(jié)省客服1000人次工時。
其二,和企業(yè)內(nèi)部自研OA系統(tǒng)、會員管理系統(tǒng)不同的是,因大模型訓(xùn)練期間對企業(yè)的算力、人力、資金能力均提出了極高的要求,目前不少企業(yè)本身不具備這種能力,這也為大模型企業(yè)拓展更多的TOB端客戶奠定了基礎(chǔ),這點在谷歌云、微軟身上已得到驗證。其中,谷歌云在4月到6月期間,客戶數(shù)量增長了15倍。微軟Q2時,每天新增近100名新客戶。
其三,和ToC端依靠訂閱費用單次幾十元到上百元的費用相比,雖說目前大模型廠商很少對外披露為客戶定制大模型的具體費用,但若是考慮大模型企業(yè)為客戶交付期間所投入的時間、人力以及物力等成本,估計整體費用也不低。
因此從這一角度來看,大模型企業(yè)服務(wù)ToB端也能更好地對沖前期大模型訓(xùn)練階段所投入的成本,幫助大模型企業(yè)盡快找到盈利方式。
混元大模型和其他大模型必有一戰(zhàn)雖說未來行業(yè)大模型的市場空間值得想象,但目前產(chǎn)業(yè)大模型距離真正商業(yè)化落地仍面臨一些現(xiàn)實挑戰(zhàn)。
一是廠商總把大模型看成萬金油,但行業(yè)需要的理解和專注。不少大模型企業(yè)覺得只有我有大模型,各行業(yè)的客戶都要找我合作。
但本質(zhì)上來看,相較于通用大模型而言,產(chǎn)業(yè)大模型實則對廠商的要求了更高的要求。比如如何針對不同行業(yè)發(fā)展存在的痛點,給出清晰的戰(zhàn)略打法。如何在行業(yè)數(shù)據(jù)匱乏的背景下,訓(xùn)練出更為精準更符合企業(yè)需求的大模型等等。
二是大模型關(guān)注的為產(chǎn)品算法創(chuàng)新,但行業(yè)實則需要的是需要的是工程化和可操作。
簡單來說就是,下游客戶需要的是類似于SaaS產(chǎn)品那樣通過標準化的產(chǎn)品,在讓企業(yè)內(nèi)部員工可視化操作的同時,進而幫助企業(yè)解決一系列現(xiàn)實問題。
三是AI廠商大量宣傳依靠人才能力跑通的個案,但行業(yè)需要的是低成本和可復(fù)制。
相較于歐美企業(yè)而言,我國企業(yè)本身在IT上并不愿意投入太多費用。若產(chǎn)業(yè)大模型價格后續(xù)無法完成真正下探,這也必然會對下游客戶產(chǎn)生勸退。
圖源:wind
下游需求不足之下,這就意味著導(dǎo)致大模型廠商之間的競爭更為白熱化。但失去先發(fā)優(yōu)勢的騰訊混元大模型,在交叉銷售方面可能會不計友商。
一個典型的案例就是在政務(wù)市場,華為云之所以能在政務(wù)市場保持較高的市場份額,這是因為脫胎和成長于ToB和ToG端的華為,內(nèi)部有專人負責對接ToG端需求。哪怕在ToG端某個項目上丟失,他們?nèi)詴^續(xù)跟進對接,以便后續(xù)ToG端有其他需求時,能及時跟進。
遇到華為云必敗也成了阿里云在拓展ToG端客戶時,內(nèi)部心照不宣的說法。因此從這一角度來看,騰訊混元大模型在拓展ToG端客戶時,可能無法像華為盤古大模型那樣迅速。
圖源:IDC
除上述行業(yè)因素外,互聯(lián)網(wǎng)時代,騰訊的方法論為C2B2C。簡單來說就是,將成熟的APP推向市場,獲取ToC端用戶持續(xù)增長后,再以用戶數(shù)據(jù)和資源為抓手,反向ToB。這種方法論雖讓騰訊打造出類似于微信、QQ、王者榮耀等一眾超級APP,但這種方法論并非萬能的。
其中騰訊在電商時代,起步時間雖早已拼多多、京東等友商,但時至今日騰訊內(nèi)部仍然缺乏電商基因。對標傳統(tǒng)貨架電商的增長邏輯來看,以貨架電商為模型,以履約平臺為形態(tài),完成商家和消費者的連接。再以TOC端消費者的龐大的用戶數(shù)量為基礎(chǔ),不斷吸引產(chǎn)業(yè)鏈上中游商家的入駐,進而以商家規(guī)模的提高再次反哺C端用戶,最終構(gòu)建出強者恒強的電商模型。
顯然這種模型成立的基礎(chǔ)在于,電商平臺發(fā)展前期需同時完成ToC端和ToB端的雙向連接,而非是簡單地僅拓展ToC端用戶。在大模型時代,更是如此。
一個典型的案例是,不管是ChatGPT,還是一眾國產(chǎn)大模型,從今年年初至今已完成幾個版本的迭代,這也側(cè)面說明市場根本沒有足夠的時間基于一個技術(shù)去做市場化的產(chǎn)品,當產(chǎn)品尚未打磨好時,技術(shù)就已經(jīng)在不斷迭代了。
因此對騰訊而言,既要不斷提高騰訊混元大模型的能力,進而和友商構(gòu)成差異化競爭,也需逐漸探索出真正適合混元大模型的方法論。在“既要”“又要”之下,騰訊混元大模型能否完成超過友商步伐,仍需要長期追蹤觀察。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預(yù)計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。