進入5月,國產(chǎn)大模型的風口非但沒有熄火,反倒越燒越旺。過去一個星期,就有多家企業(yè)發(fā)布AI大模型相關(guān)產(chǎn)品:
5月5日,網(wǎng)易有道發(fā)布了基于“子曰”大模型開發(fā)的AI口語老師劇透視頻,介紹其基于教育場景的類ChatGPT產(chǎn)品布局;5月6日,科大訊飛發(fā)布認知大模型“訊飛星火”,董事長劉慶峰表示有信心超越ChatGPT;同日,淘云科技發(fā)布“國內(nèi)首個”兒童認知大模型“阿爾法蛋”……
在上述公司之外,還有很多企業(yè)宣布進軍大模型,類ChatGPT產(chǎn)品正在密鑼緊鼓研發(fā)中,預計不久便會正式上線。企業(yè)的熱情毋庸置疑,AI大模型似乎已經(jīng)不是一條選擇題,而是必做題。
然而,狂熱背后不乏擔憂。大模型技術(shù)應(yīng)用范圍雖廣,目前落地的場景畢竟有限。而這群入局大模型的企業(yè),分別來自游戲、教育、動漫等諸多行業(yè),和大模型的應(yīng)用場景離得很遠。
當國產(chǎn)大模型變得泛濫,我們該如何分辨優(yōu)劣?
(圖片來自UNsplash)
沒技術(shù)不要緊,有公司靠“外援”搗鼓大模型
要評判一個大模型的優(yōu)劣,首先看技術(shù),其中最核心的是算法和算力,即訓練參數(shù)量。因為參數(shù)量越大,系統(tǒng)的知識面就會越廣,表現(xiàn)也會越穩(wěn)定。資料顯示,openAI在2020年推出的ChatGPT-3參數(shù)量已經(jīng)達到1750億,谷歌在一年后發(fā)布的PaLM則達到5400億,更不用說最新的ChatGPT-4了。
參照此技術(shù)標準,我們可以精準識別一批蹭熱點的企業(yè):它們要么確實拿出了產(chǎn)品,但參數(shù)量和ChatGPT等有較大差距,功能也較單一;更有甚者,套用別家公司的硬件、數(shù)據(jù)庫來預訓練參數(shù),本身缺乏核心技術(shù)。
當中的代表,有昆侖萬維。
4月10日,昆侖萬維宣布聯(lián)合奇點智源研發(fā)“天工3.5”國產(chǎn)大語言模型。根據(jù)發(fā)布會上的介紹,“天工3.5”定位為“中國第一個真正實現(xiàn)智能涌現(xiàn)”的大模型產(chǎn)品,具備智能問答、聊天互動、文本生成等多種應(yīng)用功能以及豐富的科學、技術(shù)、文化、藝術(shù)和歷史知識儲備。
根據(jù)官方資料,昆侖萬維最早在2020年布局AIGC業(yè)務(wù),投入數(shù)億元組建研發(fā)團隊。去年12月,“昆侖天工”首次亮相,初代產(chǎn)品提供圖像、音樂、文本及代碼AI生成功能。作為對比,大模型領(lǐng)頭羊 openAI在2019年發(fā)布ChatGPT-1,每一代產(chǎn)品的研發(fā)周期都在一年左右。
乍一看,昆侖萬維的“天工3.5”功能全面對標ChatGPT,比起百度“文心一言”、阿里“通義千問”等國產(chǎn)大模型毫不遜色。在研發(fā)速度上,昆侖萬維也領(lǐng)先于大多數(shù)國內(nèi)同行。不過昆侖萬維的缺點也很突出——“天工3.5”是和阿里云合作的產(chǎn)物,后者的參數(shù)、硬件設(shè)備幫了昆侖萬維很大忙。
事實上,昆侖萬維一直抱緊阿里云的大腿。資料顯示,過去幾年昆侖萬維的海外數(shù)據(jù)基本都在使用阿里云公有云儲存服務(wù),2020年布局AIGC時也是在阿里云的協(xié)助下建立算力集群。在“天工3.5”發(fā)布后,還有媒體爆出昆侖萬維缺乏文本生成、數(shù)據(jù)處理專利的消息,和百度、阿里形成鮮明對比。
同樣遭遇技術(shù)質(zhì)疑的,還有“AI四小龍”之一的商湯科技。
商湯科技在4月10日發(fā)布了自研大模型系統(tǒng)“日日新SenseNova”,內(nèi)含AI數(shù)字人視頻生成平臺“如影”,3D內(nèi)容生成平臺“瓊宇”和“格物”,類ChatGPT產(chǎn)品“SenseChat”等產(chǎn)品。別人都是發(fā)布單個產(chǎn)品,商湯科技一次過拿出一套“全家桶”,可見其野心之大。
然而,商湯的大模型全家桶在發(fā)布那天就有翻車跡象。演示視頻公布后,就有媒體和網(wǎng)友發(fā)現(xiàn)商湯“妙畫”生成的圖片和AI網(wǎng)站Civitai的圖片撞車,甚至還有來自Civitai的文字注釋。SenseChat則在一些基礎(chǔ)問題上表達含糊不清,其訓練參數(shù)量也遭到質(zhì)疑。
在價值研究所(ID:jiazhiyanjiusuo)看來,缺乏數(shù)據(jù)源,是昆侖萬維和商湯科技共同的命門。
“文心一言”背后有百度的海量搜索數(shù)據(jù)和語料庫,阿里的“通義千問”則有來自電商、云計算等領(lǐng)域的語料庫,流量大、用戶覆蓋面廣,能提供足夠的參數(shù)。缺乏面向C端用戶的通用產(chǎn)品、沒有參數(shù)積累,強行上馬大模型,昆侖萬維和商湯科技的尷尬處境完全可以預料。
沒應(yīng)用場景又如何?這些企業(yè)硬要和AI攀關(guān)系
除了缺乏核心技術(shù)、產(chǎn)品缺陷明顯的昆侖萬維等企業(yè),另一類企業(yè)的行為更讓人迷惑:在缺乏應(yīng)用場景的情況下,硬要給自身產(chǎn)品貼上大模型標簽、 “硬蹭”熱點。
這一類企業(yè),以專注C端服務(wù)的互聯(lián)網(wǎng)公司為主,尤其是近年來處境不佳的教育、科技金融、游戲公司。
比如專注于智能教育硬件研發(fā)的淘云科技,在5月6日發(fā)布了首個兒童認知大模型“阿爾法兒童認知大模型”和GPT機器人,并宣布把平臺的兒童原始語料加入科大訊飛的“訊飛星火”大模型中。同樣來自教育領(lǐng)域的學而思,也在近日宣布研發(fā)數(shù)學大模型MathGPT,目前已取得階段性成果,預計年內(nèi)推出。
這類企業(yè)最大的問題在于,大模型的應(yīng)用場景、目標用戶和它們的業(yè)務(wù)有巨大差異。強推大模型,根本無法為它們的用戶帶來多少幫助。
根據(jù)淘云科技董事長劉慶升的說法,“阿爾法兒童認知大模型”基于兒童場景提供更貼近幼兒理解力的生成式內(nèi)容,讓兒童用戶在輕松的氛圍下積累新知識。問題在于,類ChatGPT應(yīng)用仍無法保證100%準確率,常識性的錯誤屢見不鮮。對于認知能力有限的兒童來說,并不穩(wěn)定的大模型反倒可以帶來反作用。
當然,上面這些公司蹭熱點的目的雖然很明確,但好歹拿出了實打?qū)嵉漠a(chǎn)品或規(guī)劃。還有一些企業(yè),不僅業(yè)務(wù)場景和大模型相去甚遠,甚至還沒有拿出實際產(chǎn)品就開始往自己臉上貼金。
比如定位于“國漫IP孵化平臺和漫畫分享社區(qū)”的快看漫畫,就在4月27日宣布成立AIGC事業(yè)部。創(chuàng)始人兼CEO陳安妮更是在內(nèi)部信中表示,AI將會給內(nèi)容產(chǎn)業(yè)帶來“顛覆式”生態(tài)變革。
再比如最近一邊搗鼓直播電商、一邊忙著進軍本地生活的小紅書,也沒忘記籌備大模型團隊。根據(jù)36氪報道,小紅書在今年3月開始組建研發(fā)團隊,主要成員來自廣告NLP技術(shù)部門。4月,小紅書悄悄上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用,主打AI繪畫,但沒有大規(guī)模宣傳,至今沒有引發(fā)多少關(guān)注。
總的來說,這兩類企業(yè)的大模型布局都經(jīng)不起推敲。但蹭上大模型風口,確實為其帶來了可觀的流量,也掀起資本市場的狂歡。前面提到昆侖萬維,在發(fā)布“天工3.5”次日股價暴漲16%?;蛟S正因為市場過于狂熱,才會反過來迫使這些企業(yè)主動迎合熱點。
可惜這種熱度是無法持續(xù)的,而且還會遭到監(jiān)管機構(gòu)的重點關(guān)照。在“天工3.5”發(fā)布次日,昆侖萬維就收到了深交所的關(guān)注函,要求前者結(jié)合項目研發(fā)進度、行業(yè)政策風險、對公司財務(wù)的影響等情況,說明該業(yè)務(wù)可能面臨的風險。
雖然深交所沒有把話挑明,但明眼人都看得出這封關(guān)注函寫滿對昆侖萬維蹭熱點的懷疑。在價值研究所(ID:jiazhiyanjiusuo)看來,蹭熱點的行為正在損壞行業(yè)生態(tài)。給大模型降降火、讓市場回歸理性,對踏實搞研發(fā)的企業(yè)來說非常重要。
追趕ChatGPT,一場艱苦的馬拉松競賽
不可否認,除了上面這些蹭熱點的公司外,國內(nèi)有不少企業(yè)在認真打磨大模型產(chǎn)品,也有一定的技術(shù)積累和豐富的應(yīng)用場景。不過從百度、阿里,再到360,幾乎所有頭部企業(yè)都承認自己的技術(shù)不如openAI的ChatGPT。
5月7日,周鴻祎應(yīng)邀來到東方甄選直播間,和俞敏洪、董宇輝大談國內(nèi)的大模型創(chuàng)業(yè)熱潮。周鴻祎直言,openAI比國內(nèi)企業(yè)領(lǐng)先至少兩年,國產(chǎn)大模型有機會在一年內(nèi)追上ChatGPT-3.5,但openAI已經(jīng)開始訓練ChatGPT-5了。
“上來就說能超越ChatGPT,那叫吹牛?!?/p>
周鴻祎最后這番話,不少媒體認為是在影射5月6日發(fā)布“訊飛星火”認知大模型的科大訊飛??拼笥嶏w董事長劉慶峰在發(fā)布會上表示,“訊飛星火”在文本生成、知識問答、數(shù)學能力上已經(jīng)超過ChatGPT,目標是到今年10月,通用認知能力對標ChatGPT,并在中文上超越ChatGPT。
周鴻祎是否意有所指不得而知,可以肯定的是,投資者、用戶對國產(chǎn)大模型的耐心正在流失,要求變得更加苛刻,外部的競爭也更加激烈——留給國產(chǎn)大模型的時間已經(jīng)不多了。
5月4日,微軟宣布Bing預覽版全面開放,該系統(tǒng)此前已接入openAI的ChatGPT-4;一天后,谷歌也宣布向所有擁有Wordspace賬號的用戶開放Bard AI工具訪問權(quán)限。
微軟和谷歌先后走向開放,意味著新一輪用戶爭奪戰(zhàn)正式打響。一旦它們滲透進國內(nèi)市場,面對技術(shù)上的差距,國產(chǎn)大模型并沒有太多應(yīng)對方法。比起那群蹭熱點的企業(yè),追趕openAI的骨干力量更值得我們關(guān)注——特別是百度、阿里、騰訊三巨頭,周鴻祎治下的360,疑似被其揶揄的科大訊飛實力也不容小覷。
這幾家公司的優(yōu)勢是相似的:雄厚的資金儲備;擁有諸多面向用戶的產(chǎn)品/服務(wù),語料庫十分豐富;主營業(yè)務(wù)貼近大模型應(yīng)用場景,如百度和360的搜索,騰訊的社交媒體,阿里的云計算和電商,科大訊飛的智慧辦公等?,F(xiàn)階段,這些企業(yè)的產(chǎn)品距離ChatGPT當然還有一定差距,但并非沒有追趕的機會。
要知道,即便是技術(shù)領(lǐng)跑全行的openAI,也有自己的苦惱。過去一年,隨著ChatGPT走紅openAI的估值也是一路走高,成為全球范圍內(nèi)升值最快的獨角獸——可惜隨之飆升的,還有虧損額。
據(jù)外媒報道,openAI上一財年凈虧損達到5.4億美元,同比幾乎放大一倍。每一次預訓練參數(shù)都要耗費巨資,要提升系統(tǒng)穩(wěn)定性又必須不斷加大參數(shù)量和預訓練頻次,虧損自然成為無解難題。國盛證券的研報指出,通過測算,2800億參數(shù)量的大模型預訓練成本約為200萬美元/次,谷歌的PaLM號稱擁有5400億參數(shù),單次預訓練成本將高達1200萬美元。
今年2月推出的付費版ChatGPT和其他商業(yè)化嘗試收效甚微,短時間內(nèi)不可能覆蓋預訓練所需成本。CEO Sam Altman曾暗示,公司未來幾年可能需要籌集約1000億美元的資金,才能進一步提升技術(shù),打磨下一代產(chǎn)品。
openAI的經(jīng)歷表明,AI大模型研發(fā)如同一場漫長且艱難的馬拉松——不要總是奢望彎道超車,踏踏實實和參數(shù)打交道是成功的基礎(chǔ)。
寫在最后
水能載舟亦能覆舟,狂熱的市場氛圍既給企業(yè)帶來了資金和關(guān)注度,也帶來了難以預估的風險。近段時間,證監(jiān)會等監(jiān)管機構(gòu)已經(jīng)加大管控力度,不少公司也主動出面自證清白:據(jù)不完全統(tǒng)計,4月底至今已有世紀天鴻、萬興科技、中科信息、唐德影視等多家上市企業(yè)發(fā)布股票交易異常波動公告,澄清自身業(yè)務(wù)和AI、大模型的關(guān)系。
經(jīng)過移動互聯(lián)時代的洗禮,蹭熱點、追風口的情況太過常見了。似乎任何一個風口都逃不過從萌芽到爆發(fā),再走向混亂、重塑秩序的過程。但在亂戰(zhàn)過后,有的風口出清泡沫、置之死地而后生;有的賽道卻徹底沉淪,如一顆流星般結(jié)束自己絢爛卻短暫的一生。
走在時代前沿的AI大模型,似乎更有可能成為前者,不過需要所有從業(yè)者、監(jiān)管機構(gòu)的共同努力才能保證健康發(fā)展。大模型是一條技術(shù)門檻、資金門檻都很高的賽道,蹭熱點的企業(yè)注定無法長久。加強監(jiān)管、凈化行業(yè)環(huán)境、驅(qū)逐不良玩家可能會帶來短期混亂,但對行業(yè)的長期發(fā)展肯定是有益的。
風險提示及免責聲明:
本文不構(gòu)成任何投資建議,市場有風險,投資需謹慎。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 騰訊隱身,令人生畏
- 迪卡儂的價格、lululemon的品質(zhì),平替正成為年輕消費者的心頭好
- 三場與AI有關(guān)的死亡
- 100億美元史上最大融資的背后,國內(nèi)外巨頭齊瞄準Data+AI
- 有一種羨慕叫“別人家的年終獎”:京東采銷平均23薪,全網(wǎng)熱議“人的價值”
- 行業(yè)首個“人機大戰(zhàn)”對壘!AI翻譯已媲美人工
- 蘋果開啟年終大促,降價1200元,被國產(chǎn)手機嚇怕了?
- 1999 元起,OPPO A5 Pro 超防水、超抗摔、超耐用
- 長三角,如何把數(shù)據(jù)要素變成新長江?
- 大模型,在內(nèi)卷中尋找出口
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。