科技云報道原創(chuàng)。
最近一周,鋪天蓋地都是大模型降價的消息。
字節(jié)降完,智譜降;阿里降完,百度降;騰訊降完,科大訊飛降......是不是很像蹲蘿卜的游戲?
事實上,國內有頭有臉的大廠幾乎都加入了這場游戲。接二連三地降價,讓人一瞬間有了當年共享單車和云計算價格戰(zhàn)的感覺。
互聯(lián)網時代,所有人都習慣于大規(guī)模燒錢來獲得最后的勝利。但AI時代,這套玩法還行得通嗎?
國產大模型“以厘計價”
降價在商業(yè)世界里并不難理解,無非是“降價促銷”、“以價換量”。
大模型領域的扛把子OpenAI就已經多次降價。
從去年3月OpenAI發(fā)布GPT4到現(xiàn)在,其產品從GPT4升級到GPT-4o,輸入價格從0.03美元/千tokens下降到0.005美元/千tokens,降幅為83%;輸出價格從0.06美元/千tokens下降到0.015美元/千tokens,降幅為75%。
但驚人的是,國內大模型比OpenAI更狠,直接把價格“打骨折”。
5月11日,智譜AI大模型的個人版GLM-3Turbo模型產品的調用價格從0.005元/千tokens降低至0.001元/千tokens,直降80%;GLM-3 Turbo Batch 批處理API也便宜了50%,價格僅為0.0005元/千tokens。
緊接著,5月15日,字節(jié)宣布豆包通用模型pro-32k版、pro-128k版在企業(yè)市場的推理輸入價格僅為0.0008元/千tokens、0.005元/千tokens,較行業(yè)降幅達99.3%、95.8%,并聲稱已經擊穿了大模型行業(yè)的最底價。
但“價格屠夫”還在后面。5月21日,阿里云通義千問GPT-4級主力模型Qwen-Long的API輸入價格降至0.0005元/千tokens,直降97%。
各大廠動不動就降價90%以上,已經是硝煙四起,然而還有更狠的角色——百度直接宣布文心Speed和文心Lite兩款模型免費,開啟了大模型API調用的“免費時代”。
5月22日,騰訊也按耐不住了,宣布主力模型之一的混元-lite 模型不僅從4k升級到256k,而且全面免費。
同日,科大訊飛首推永久免費大模型,訊飛星火API能力向全球用戶開放。
有網友戲稱,大模型正從“以分計價”的定價模式向“以厘計價”的時代邁進。
價格戰(zhàn)提前來臨?
其實大模型降價并不稀奇,但稀奇的是商業(yè)化還沒跑通,怎么價格戰(zhàn)就先來了?
根據此前預期,大模型大致將按照每年50%-75%幅度降本,但現(xiàn)在大模型的降本速度遠超預期。
答案很簡單:加快商業(yè)化落地。
隨著大模型參數(shù)越來越大,研發(fā)成本也越來越高。在巨大的成本壓力下,大模型廠商不得不加緊尋找一條商業(yè)化之路。
根據無問芯穹發(fā)起人汪玉,用公開數(shù)據做了一次針對算力成本數(shù)量級的測算,假設GPT-4 Turbo每天要為10億活躍用戶提供服務,每年的算力成本可能超過兩千億,這還不包括模型訓練的投入。
華為大模型負責人田奇曾提到,大模型開發(fā)和訓練一次需要約1200萬美元,這表明即使技術再領先的公司,大模型的訓練也是非常昂貴的。
百川智能創(chuàng)始人CEO王小川也曾表示,每1億參數(shù)對應訓練成本在1.5到3萬人民幣之間。因此,一個千億級參數(shù)的模型單次訓練成本預估在3000萬至5000萬人民幣之間。
顯然,高昂的研發(fā)價格,已經成了AI商業(yè)化的枷鎖。絕大部分公司的收入仍然還在億的級別。以這種成本去打造商業(yè)閉環(huán),顯然是不成立的,而降價就成了最直接且最快速的落地方式。
同時,價格戰(zhàn)能掀起的另一個因素是,大模型技術已經卷得差不多了。
外賣、快遞、網約車、社區(qū)團購乃至新能源車等價格戰(zhàn)火熱的行業(yè),或多或少都是由于同質化競爭而導致的,大模型也可能是當前卷性能帶來的收益越來越低。
在《LLMs正達到收益遞減的證據——及其可能意味著什么》一文中,作者認為大模型在性能提升方面可能已達到收益遞減的臨界點。以OpenAI為例,從GPT-2到GPT-3、GPT-3到GPT-4都有巨大的飛躍,但GPT-4到GPT-4 Turbo就沒有那么多了。
如果大模型的性能發(fā)展真的要迎來一面墻,那么對于大模型公司來說,如何搶下用戶是現(xiàn)階段最重要的一步。
目前,國內大模型先頭部隊大多已接近GPT-4的能力,而這一能力已具備商業(yè)化的基礎。經過一年多的技術比拼,大模型顯然已經到了大規(guī)模市場驗證的階段。
因此,2024年大模型開始了從“卷技術”向“卷應用”的轉變,商業(yè)化、落地應用成為大模型公司的主旋律,而降價將為大模型的應用落地帶來了極大推動力。
誰能扛住價格戰(zhàn)?
雖然大家都在價格上卷起來了,但并不是所有企業(yè)都能加入價格戰(zhàn)。
降價涉及到大模型的研發(fā)、訓練、推理等一系列成本的優(yōu)化,只有把大模型的研發(fā)成本盡可能的降低到最小,才有降價的空間和資本。
毋庸置疑,大廠是最扛打的一波。
在這輪價格戰(zhàn)里,云廠商是最重要的發(fā)起方之一,先有字節(jié)的火山引擎,后來百度智能云、阿里云、騰訊云先后加入。
對云計算公司來說,大模型商業(yè)化能不能跑通,并不重要。更重要的是,如何依托于大模型新需求,打破過去云廠商的格局,重新建立自己的領先位置。
根據媒體報道,阿里云內部已經提出一個非常激進的目標,在三年之內,要占領國內大模型云計算市場的90%。這也是為什么阿里把國內5家大模型獨角獸都投了一遍。
而火山引擎自2020年才對外提供服務開始,一直想以傳統(tǒng)云計算模式去追趕大廠,始終沒有太大起色。大模型出現(xiàn)改變了這一切。去年以來,它開始將字節(jié)跳動的AI能力作為突破口,試圖打破舊有格局。這次降價也是這一邏輯下發(fā)生的。
事實上,基于大模型賣云服務并不是大廠唯一的商業(yè)模式?;诖竽P椭貥嫅?,乃至打造大模型時代的超級應用,成為大廠在AI時代的新目標。
如果能夠像互聯(lián)網和移動互聯(lián)網時代一樣,誕生淘寶、微信這樣的超級應用,大廠們又將迎來商業(yè)史上新的輝煌。
目前,百度已經完成了對百度文庫、百度搜索、百度地圖、如流等業(yè)務的AI重構。
阿里對釘釘、高德地圖、閑魚、餓了么、優(yōu)酷、盒馬、淘票票,天貓、淘寶等阿里集團最核心的產品進行了全面升級。
字節(jié)內部也開啟了賽馬機制,抖音、剪映等50多個業(yè)務線各自為營開始了AI探索。過去一年里,除了主打的豆包App外,基于豆包大模型,還推出了互動娛樂應用“貓箱”,以及星繪、即夢等AI創(chuàng)作工具。
騰訊則將混元大模型落地在超600個騰訊內部業(yè)務和場景中,包括企業(yè)微信、騰訊會議、騰訊文檔等“一門三杰”產品,也包括騰訊樂享、騰訊電子簽、騰訊問卷、騰訊云AI代碼助手等協(xié)作SaaS產品。
相比大廠的高舉高打,大模型創(chuàng)業(yè)公司就顯得不那么從容了。
百川智能創(chuàng)始人王小川表示,百川并不會“摻和”到價格戰(zhàn)當中,原因在于,當前To B并不是百川的主要商業(yè)模式,價格戰(zhàn)對其影響有限,百川更多的精力,還是會放在超級應用當中。
零一萬物的李開復博士認為,目前零一萬物帶給的性能、性價比都很高了,不打算降低YI系列模型的API價格?!熬拖裉厮估粫驗閯e的牌子車比他賣得很便宜,他也要來降價。”
率先掀起價格戰(zhàn),喊著“不做應用做研究”的DeepSeek,也沒有在各家大廠密集召開降價發(fā)布會時發(fā)聲,顯得無心參戰(zhàn)。
無論創(chuàng)業(yè)系公司如何自圓其說,和財大氣粗的大廠相比,一不小心都有可能震蕩出局。
更大的挑戰(zhàn)在于,國內大廠和大模型廠商基本都走模型+應用路線,推出各自的To C App,不少AI助手也已經開始大規(guī)模的市場投放。
不管是基礎大模型的價格戰(zhàn),還是To C應用的用戶爭奪戰(zhàn),戰(zhàn)火都已經燒起來了。
結語
無論從哪個角度看,把大模型拉入價格競爭,都不是一個明智的做法,也不一定會讓大模型廠商迎來商業(yè)閉環(huán)。但現(xiàn)實是,這事就這樣發(fā)生了。
既然大模型未來的發(fā)展誰都看不清,那就先降價把用戶拿下來再說。這是移動互聯(lián)網過去10年被證明過無數(shù)次的真理。
拿到用戶,不管商業(yè)化能不能跑通,至少融資、并購后面還有的聊。但沒有用戶,你連上談判桌的資管都沒有。
在這種情況下,大模型廠商降低開發(fā)者成本,讓更多開發(fā)者參與進來,幫助他們去觸碰曾經觸碰不到的用戶,顯然就是一條必經之路。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。