2023年接近尾聲,AI大模型的熱度絲毫不減。
谷歌剛宣布為開發(fā)人員提供新版Gemini大模型并承諾降低使用成本,微軟就推出了擁有27億參數(shù)的全新語言模型Phi-2。在頭部巨頭動作頻頻時,腰部玩家開始抱團,比如百奧幾何與智譜AI開始共建自然語言-生命語言多模態(tài)大模型。
雖然百度等巨頭早在2019年前后就已布局大模型技術(shù),但2023年確實算得上是“大模型元年”,幾乎所有頭部科技大廠都深度參與研發(fā),熱錢不斷涌入,將“千模大戰(zhàn)”推向新的高潮。然而,在大模型“軍備競賽”之余,業(yè)內(nèi)出現(xiàn)了越來越多的冷思考:基礎(chǔ)大模型越來越多,能實現(xiàn)產(chǎn)業(yè)化落地為何寥寥無幾?2024年,AI技術(shù)產(chǎn)品化、產(chǎn)業(yè)化以及商業(yè)化,將是大模型發(fā)展的重中之重。
(圖片來自UNsplash)
“千模大戰(zhàn)”高潮迭起,產(chǎn)業(yè)化成頭號難題
從參與企業(yè)規(guī)模、大模型數(shù)量與市場規(guī)模來看,中國已是僅次于美國的全球第二大大模型產(chǎn)業(yè)中心。
作為國產(chǎn)大模型的“扛旗者”,李彥宏在上個月的西麗湖論壇上提及一組數(shù)據(jù):截止今年10月國內(nèi)發(fā)布的大模型多達(dá)238個,較6月翻了整整三倍,Hugging Face平臺上可供下載的文本生成大模型則接近3萬個。按比例劃分,美、中兩國已上線/在研大模型數(shù)量占到全球的80%以上,吊打其他國家或地區(qū)。
據(jù)速途網(wǎng)測算,2023年中國大模型市場規(guī)模約為147億元,同比翻了一倍,預(yù)計在2028年將突破千億大關(guān)。龐大的市場規(guī)模,巨頭的高度重視,誘惑著資本不斷加大投入;AI對提升生產(chǎn)效率與經(jīng)濟質(zhì)量有著重要意義,一定程度關(guān)系到國家核心競爭力,因此也得到了有關(guān)部門高度重視。可以說,大模型狂飆一整年,離不開政策的支持、巨頭的重視和資本的熱情。
在大模型技術(shù)有序發(fā)展上我國走在世界前列,網(wǎng)信辦等七部委聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》、北京科委發(fā)布的《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025)(征求意見稿)》等中央和地方政府扶持措施相繼出爐,為大模型的發(fā)展掃清障礙,既提供必要資源傾斜,也避免技術(shù)無序發(fā)展。
資本方面,百度、阿里、騰訊、字節(jié)、科大訊飛、美團、京東、網(wǎng)易等大廠均在布局大模型技術(shù),有實力的初創(chuàng)企業(yè)則成了VC們爭搶的香饃饃,熱錢不斷涌入。中國新一代人工智能發(fā)展戰(zhàn)略研究院的報告顯示,截止10月底,國內(nèi)已有38起大模型投融資事件,現(xiàn)存AI企業(yè)已超過2200家。
(圖片來自貝殼財經(jīng))
而在技術(shù)層面,文心大模型、阿里通義、訊飛星火、智譜等國產(chǎn)基礎(chǔ)大模型在多個榜單上的評測均位居前列,一定程度上已能與GPT PK。
大模型行業(yè)欣欣向榮,但依然存在一些隱憂——比如困擾大部分從業(yè)者的產(chǎn)業(yè)化落地問題。任何前沿技術(shù)都要轉(zhuǎn)化為產(chǎn)品或者說應(yīng)用才能為人所用,才能發(fā)揮價值。AI大模型當(dāng)前在基礎(chǔ)技術(shù)迎頭直追的同時,更需要深入到產(chǎn)業(yè)端的場景中,在企業(yè)的生產(chǎn)經(jīng)營中,或者用戶的生活學(xué)習(xí)中發(fā)揮作用。事實上,后者正是中國AI產(chǎn)業(yè)一直以來的優(yōu)勢:相較于下棋、畫畫、作詩而言,中國科技從業(yè)者更接地氣,善于將技術(shù)應(yīng)用到場景中,讓其為產(chǎn)品、應(yīng)用或者服務(wù)所用——哪怕沒那么炫酷也不重要。
三個標(biāo)桿案例,看大模型產(chǎn)業(yè)化落地之路
大模型產(chǎn)業(yè)化的難點很多,比如不同行業(yè)數(shù)字化程度參差不齊,不同規(guī)模、不同領(lǐng)域的企業(yè)對AI的應(yīng)用需求、可承擔(dān)的成本,有顯著差別,這里的成本除了資金等經(jīng)濟成本外,還有應(yīng)用AI技術(shù)改造業(yè)務(wù)的風(fēng)險、時間與邊際成本。正因為此,當(dāng)前雖然很多企業(yè)都在關(guān)注大模型技術(shù),但真正做到用大模型技術(shù)來改造業(yè)務(wù)甚至打造AI原生應(yīng)用的企業(yè),卻少之又少。
不過浪里淘沙,我們也能看到一些大模型技術(shù)和產(chǎn)業(yè)結(jié)合的標(biāo)桿案例。
1、度小滿軒轅大模型:國內(nèi)首個開源金融大模型
數(shù)據(jù)驅(qū)動的金融業(yè)是數(shù)字化程度較高的產(chǎn)業(yè),數(shù)據(jù)庫、存儲、服務(wù)器、自動化、信息安全等等數(shù)字化基礎(chǔ)設(shè)施,均是在金融業(yè)率先應(yīng)用普及。在AI技術(shù)普及過程中,金融業(yè)很早就在積極探索將AI與客服、風(fēng)控、授信、營銷等場景結(jié)合,降本增效的同時,提升客戶體驗。
2023年,大模型技術(shù)爆發(fā)。金融科技先鋒平臺度小滿在5月就率先開源了國內(nèi)首個千億級中文金融大模型“軒轅”;9月,“軒轅70B”開源開放可被自由下載和使用。作為金融場景而生的行業(yè)大模型,軒轅在智能化能力、功能服務(wù)以及信息安全上均有很強的針對性。
這種針對性體現(xiàn)在多個方面:比如軒轅用來訓(xùn)練的數(shù)據(jù)集包含大量機構(gòu)研報、專業(yè)名詞、行情數(shù)據(jù)等金融行業(yè)資料,賦予了其極強的金融信息理解和處理能力。
在技術(shù)實力上,軒轅大模型不遑多讓。其已通過注冊會計師考試、銀行/證券/保險/基金/期貨從業(yè)資格、理財規(guī)劃師、經(jīng)濟師等金融領(lǐng)域權(quán)威考試。而在清華大學(xué)、上海交大和愛丁堡大學(xué)聯(lián)合發(fā)布的C-Eval大語言模型測評榜單和微軟亞洲研究院、MBZUAI、上海交大聯(lián)合推出的CMMLU榜單中,軒轅均取得了國內(nèi)所有開源模型排名第一的成績。C-Eval和CMMLU是目前較為權(quán)威的兩大專業(yè)榜單,能夠同時奪得第一,對軒轅這樣的行業(yè)大模型來說絕對算得上好成績了。
度小滿軒轅大模型正在金融場景深入應(yīng)用。
在內(nèi)部,軒轅大模型已深入賦能度小滿營銷、客服、風(fēng)控、辦公再到研發(fā)等場景,并已初見成效。在代碼助手方面,用大模型輔助生成的代碼,采納率能夠達(dá)到42%,幫助公司整體研發(fā)效率提升了20%;在客服領(lǐng)域,大模型推動服務(wù)效率提升了25%。在智能辦公領(lǐng)域,大模型目前的意圖識別準(zhǔn)確率已達(dá)到97%。
度小滿向來都很重視金融科技能力對外輸出。度小滿CTO許冬亮透露,軒轅在5月開源時就有上百家金融機構(gòu)發(fā)出試用申請。從企業(yè)客戶的反饋來看,軒轅大模型的專業(yè)能力有口皆碑,2.0版本上下文對話長度增加至8K,對“非利息收入增長趨勢”等金融業(yè)的深度問題也能給出專業(yè)解釋。
2、阿里通義千問大模型,在電商行業(yè)貫徹“AI驅(qū)動”戰(zhàn)略。
2023年阿里巴巴有許多大的變動,“用戶為先、AI驅(qū)動”成為新的戰(zhàn)略方向。4月11日發(fā)布通義千問大模型的時候,時任阿里巴巴集團董事長、阿里云智能集團CEO張勇就表示“所有軟件都值得用大模型升級改造,阿里所有產(chǎn)品都會接入通義千問?!?/p>
阿里確實說到做到,作為阿里大本營的電商業(yè)務(wù)就早已全面AI化。以通義千問大模型為基礎(chǔ),淘天集團推出了一系列面向B、C兩端的AI工具。
面向B端的工具包括官方客服機器人、圖片智能生成、營銷投放自主監(jiān)測等,今年雙11大促期間商家調(diào)用后臺AI工具的次數(shù)超過15億次;面向C端則推出AI智能助手淘寶問問,上線兩個月受邀試用人數(shù)突破500萬。B端工具可提高商家經(jīng)營效率、降低流量成本,C端功能則可顯著改善用戶體驗,在電商行業(yè)狂卷價格時形成差異化競爭力。
大模型與電商場景的結(jié)合,阿里走得最快也最遠(yuǎn),馬云在阿里內(nèi)網(wǎng)回帖中甚至提到了“AI電商”這一讓人耳目一新的概念。
為了進(jìn)一步強化大模型技術(shù)實力,以及深化AI與業(yè)務(wù)的融合,近日淘天集團被爆暗中組建新的AI團隊,高調(diào)高薪招聘AI頂尖人才,抓緊時間訓(xùn)練針對電商產(chǎn)業(yè)的專屬大模型“圖靈”。根據(jù)淘天集團此前透露的消息,未來一年會向商家發(fā)布更多AI工具,包括AI開店、經(jīng)營咨詢、智能周報等,服務(wù)范圍涉及商家日常經(jīng)營的方方面面。在阿里的推動下,大模型和電商產(chǎn)業(yè)的結(jié)合才剛剛開始??梢灶A(yù)見,2024年,頭部電商平臺均會加碼“大模型電商”。
3、科大訊飛星火大模型:大模型+教育的標(biāo)桿玩家。
科大訊飛的第一標(biāo)簽是語音智能,第二標(biāo)簽就是智能教育科技巨頭。在大模型技術(shù)出現(xiàn)前,科大訊飛在AI技術(shù)上就已耕耘多年,其相當(dāng)一部分營收就來自智能教育服務(wù),如口語評測、教育硬件等教育智能化服務(wù)。
在大模型技術(shù)爆發(fā)后,星火大模型和教育行業(yè)的結(jié)合更是轟轟烈烈。今年5月訊飛星火認(rèn)知大模型1.0版本發(fā)布次日,帶飛了A股教育科技板塊,除了科大訊飛外,學(xué)大教育、行動教育、國新文化全跟著漲停,呈現(xiàn)出“星火燎原”之勢。
從1.0到3.0,訊飛星火大模型一直重點攻克代碼能力和多模態(tài)能力,并基于技術(shù)上的突破開發(fā)出更多針對學(xué)校、教育企業(yè)以及教師和學(xué)生群體的功能、應(yīng)用。比如針對學(xué)校管理環(huán)節(jié)的學(xué)生及教師信息管理、離校申請審核功能,為教師量身打造的教學(xué)課件制作助手,給學(xué)生提供的AI一對一啟發(fā)式對話功能等。與此同時,訊飛在其翻譯筆、錄音筆、學(xué)習(xí)機、辦公本等教育硬件上也在深入應(yīng)用大模型技術(shù),強化產(chǎn)品力,鞏固在這一品類上的優(yōu)勢。
(圖片來自訊飛星火官網(wǎng))
金融、電商與教育,三個行業(yè)的頭部玩家,均能在大模型的改造下獲得全新增長點,可見大模型產(chǎn)業(yè)化并非癡人說夢,而是必然趨勢。
大模型開卷2024:有無產(chǎn)業(yè)化秘訣?
度小滿、阿里、科大訊飛們只是開了個好頭,大模型產(chǎn)業(yè)化程度依然有很大提升空間,特別是歷史悠久、數(shù)字化程度較低的農(nóng)業(yè)、制造業(yè)、物流航運業(yè)、能源業(yè)等產(chǎn)業(yè),更是亟需擁抱大模型技術(shù)提高生產(chǎn)效率,實現(xiàn)從數(shù)字化到智能化的跨越。鑒于此,加速AI技術(shù)產(chǎn)品化、產(chǎn)業(yè)化和商業(yè)化將是大模型行業(yè)在2024年的頭號任務(wù)。誰能率先跑通產(chǎn)業(yè)化落地路徑,誰就可以在“千模大戰(zhàn)”中笑到最后。那么,標(biāo)桿玩家們給大模型產(chǎn)業(yè)化帶來了什么啟示呢?
第一,不重復(fù)發(fā)明輪子,有針對性地選擇訓(xùn)練參數(shù)和設(shè)計功能服務(wù)。
基礎(chǔ)大模型已經(jīng)很多了,市面上缺的是能跟抗衡甚至超越GPT的頂尖基礎(chǔ)大模型,以及可讓千行百業(yè)更低成本、更低門檻、更快應(yīng)用的“產(chǎn)業(yè)大模型”。而要做出強大的產(chǎn)業(yè)大模型,需要“既懂AI技術(shù)又是產(chǎn)業(yè)專家”。
度小滿就是一個很好的例子,一邊有背靠百度的AI技術(shù)底子,另一邊有深耕金融科技行業(yè)多年積攢下的產(chǎn)業(yè)認(rèn)知、能力、場景、生態(tài)等資源。
據(jù)悉,軒轅雖是基于擁有1760億參數(shù)的Bloom大模型訓(xùn)練而成,但也離不開度小滿這些年積累的千億tokens中文預(yù)訓(xùn)練數(shù)據(jù)集,包括銀行、保險、基金等行業(yè)的基礎(chǔ)知識與巨量參數(shù)。因為有后者,軒轅大模型才有遠(yuǎn)超同類競品和通用大模型的金融信息處理能力,也才可以面向金融業(yè)的痛點場景提供針對性的功能服務(wù)。
第二,深入貼合行業(yè)需求“定制”大模型功能服務(wù),而不是閉門造車。
技術(shù)類公司容易出現(xiàn)“拿著錘子找釘子”的問題,如果不能貼合真實需求,技術(shù)再強大都可能只是自嗨。
為什么度小滿、阿里和科大訊飛可以在大模型產(chǎn)業(yè)化上先嘗到甜頭?因為阿里本身就是電商產(chǎn)業(yè)的龍頭,度小滿從成立之日起一直深度參與國內(nèi)科技金融行業(yè)建設(shè),科大訊飛也深耕智能教育行業(yè)十?dāng)?shù)載,它們對相應(yīng)行業(yè)理解非一般企業(yè)所能及。讀懂行業(yè)運作邏輯和深層次問題,就能洞悉企業(yè)、從業(yè)者的真正痛點,并給出行之有效的解決方案。
以度小滿為例,基于的理解、生成、邏輯和記憶四個基礎(chǔ)能力,軒轅大模型融合金融行業(yè)的使用習(xí)慣、優(yōu)化需求,提供了一系列針對性功能。比如個人信貸管理服務(wù),軒轅大模型為銀行客戶提供客戶歷史信息管理、用戶多層次需求分析功能,給用戶提供專業(yè)問題自然語言交互問答服務(wù),充分提高雙方的處理效率。度小滿在服務(wù)金融機構(gòu)和自有客戶時洞察了許多需求,才可以做出真正能用、有用、好用的金融大模型產(chǎn)品。
第三,眾人抬柴火焰高,大模型不是獨角戲,必須惠及行業(yè)參與者。
中小企業(yè)是產(chǎn)業(yè)鏈的主力軍,然而因為受限于資金實力與人才資源,往往很難再第一時間應(yīng)用新技術(shù),特別是門檻很高的新技術(shù)。相較于深度學(xué)習(xí)而言,大模型需要巨量算力、巨量數(shù)據(jù)和巨量算法,門檻高出了許多,對很多企業(yè)來說有些可望不可即。這對頭部玩家來說是機遇所在,如果堅持普惠開放路線,既可讓大模型技術(shù)有“產(chǎn)業(yè)化”的落點,也可以在大模型產(chǎn)業(yè)化中獲取對應(yīng)價值。
在度小滿和北大光華管理學(xué)院聯(lián)合舉辦的大模型技術(shù)與應(yīng)用論壇上,度小滿CTO許冬亮就發(fā)表過類似觀點,他認(rèn)為大模型是中小金融機構(gòu)突圍而出的機會,因為它們可通過應(yīng)用創(chuàng)新加快數(shù)字化、智能化升級進(jìn)程,繼而跨越數(shù)字化鴻溝。
也不難發(fā)現(xiàn),“開放”成了成功落地產(chǎn)業(yè)的大模型的最大公約數(shù)。度小滿的軒轅、阿里的通義千問、科大訊飛的星火走的均是開源開放路線。正如許冬亮所言,將大模型能力開放給金融機構(gòu),不僅可以加快技術(shù)的推廣普及,還能降低使用門檻,是實現(xiàn)技術(shù)普惠的必然選擇。
跟區(qū)塊鏈等新興技術(shù)的曇花一現(xiàn)不同,大模型的熱度不會驟然下降。一方面,大模型技術(shù)在2024年將會縱深到更多產(chǎn)業(yè),C端,大模型驅(qū)動的爆款現(xiàn)象級應(yīng)用一定會出現(xiàn),B端,大模型產(chǎn)業(yè)化的案例只會越來越多。另一方面,大模型技術(shù)本質(zhì)是深度學(xué)習(xí)技術(shù)的延續(xù)。AI技術(shù)已發(fā)展10余年,未來幾十年都將是科技產(chǎn)業(yè)的基礎(chǔ)技術(shù)。大模型是AI浪潮上最大的一朵浪花,而AI浪潮,將持續(xù)澎湃。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 長壽產(chǎn)業(yè)大動作!中科院新技術(shù)NMN產(chǎn)能升100倍,全民百歲時代可期?
- 昆侖萬維發(fā)布天工AI高級搜索功能,最懂金融投資科研學(xué)術(shù)的AI搜索
- 昆侖萬維重磅發(fā)布天工AI高級搜索功能,做最懂金融投資、科研學(xué)術(shù)的AI搜索
- 真我GT7 Pro發(fā)布,3599起堪稱驍龍8至尊版質(zhì)價比之王
- MLPerf AI存儲基準(zhǔn)測試,中國速度領(lǐng)跑
- 假開源真噱頭?開源大模型和你想的不一樣
- FaceTime成詐騙“幫兇”,蘋果是怎么一步步丟掉“安全”光環(huán)的?
- 收入首超特斯拉,比亞迪市值為何只有六分之一?
- 誰才是折疊屏界的扛把子?華為、榮耀、vivo卷出新高度
- 姜萍也是受害者,阿里數(shù)學(xué)競賽存在漏洞
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。