外灘掀起了“AI熱”

撰文 | 李信馬

題圖 |?螞蟻集團

熱鬧了3天的上海外灘大會終于落下了帷幕,但余音還在回蕩。作為金融科技頂會,上一屆的外灘大會時,金融科技中金融的“濃度”很高,而這一屆大會,科技成為了主旋律。人工智能,尤其是大模型,成了本屆大會的熱詞。

這也不奇怪,根據(jù)最新的統(tǒng)計,國內“百模大戰(zhàn)”的參戰(zhàn)方已經增加到了至少130家公司,其中做通用大模型的有78家。從投資的角度來看,今年上半年生成式人工智能領域的投資額,已經超過了去年全年,美國頭部的前25家AI公司總融資額超過了170億美元。

麥肯錫中國區(qū)主席、全球資深董事合伙人倪以理在外灘現(xiàn)場預測:“AI 對全球經濟的潛在收益將達到 25 萬億美元,是當前所有企業(yè)最重要的賽道之一,但這個時代剛剛開始?!?/p>

大模型的魅力為什么這么大?螞蟻集團(以下簡稱“螞蟻”)董事長兼CEO井賢棟引用電影《奧本海默》的一句臺詞:“this is not a new weapon. this is a new world.”在他看來,大模型是一項新技術,但又不只是新技術,而是足以引發(fā)世界級的變革。

自然而然地,螞蟻也發(fā)布了他們的金融大模型。據(jù)了解,這款大模型是基于螞蟻的自研基礎大模型,然后針對金融產業(yè)深度定制的。此外,螞蟻還發(fā)布了基于金融大模型能力的兩款產品:智能金融助理“支小寶2.0”,服務金融產業(yè)專家的智能業(yè)務助手“支小助”。

其中,“支小寶2.0”已內測近半年,將在完成相關備案工作后上線?!爸≈闭谂c螞蟻平臺合作機構內測共建,為理財顧問、保險代理、投研、金融營銷、保險理賠等金融從業(yè)者打造全鏈條的AI業(yè)務助手。?

可以說,在金融科技領域,以后大模型也是頂流了。

對到場的專家和學者們來說,他們又是怎么看待大模型的呢?以及,大模型又該如何落地行業(yè),真正改變世界呢?

01.大模型時代

人工智能70年的發(fā)展中,經歷了多次的高峰和低谷,但“讓機器掌握完成復雜任務的知識和能力”這一終極目標卻基本沒有改變。

當前,我們可以說已經進入了“大模型時代”,大模型的特點就是可以實現(xiàn)大規(guī)模無標注數(shù)據(jù)的深度學習,由于無標注數(shù)據(jù)廉價且易得,模型學習的范圍和水平都迎來了極大的提升,大模型的參數(shù)量也在不斷攀升,從1億左右增長到了現(xiàn)在GPT的31750億,可以說是科技領域的暴力美學。而且從ChatGPT的經驗來看,更多的數(shù)據(jù)、更大的模型還可以帶來更多的智能。(以下部分內容和圖片來自清華大學計算機科學與技術系副教授劉知遠的演講,文中不再另做說明)

圖片來源:外灘大會

可以說,大模型是邁向通用人工智能的技術。劉知遠總結了大模型在兩方面的優(yōu)勢,首先,是通用框架,能有效降低開發(fā)成本。自上世紀五十年代以來,成千上萬個不同的神經網(wǎng)絡解決方案被提出過,但在2017年Transformer被提出來后,這些神經網(wǎng)絡架構日益混凝在Transformer架構下,2020年后大模型的發(fā)展,讓大語言模型架構更加統(tǒng)一。

其次是大模型的通用能力,能有效降低適配成本。以前深度學習模型總是用于專用的任務,標注專門的數(shù)據(jù),訓練專用的模型,而沒有辦法拓展到其他任務。比如場景像客服、營銷、售前,行業(yè)像房地產、金融,最后結果是每一個行業(yè)的每一個場景都要做一個小模型,總的成本就很高,但通用大模型微調后可以完成不同的任務,在每一個任務都可以有非常好的表現(xiàn)。

圖片來源:外灘大會

也因為這兩方面的突出優(yōu)勢,大模型有潛力成為智能時代基礎設施。劉知遠認為,邁向通用人工智能的路徑會是語言智能、多模態(tài)智能、工具智能、具身智能、群體智能,目前人類語言的智能已經基本被實現(xiàn)了,接下來會是其他智能相關探索。

圖片來源:外灘大會

以上是技術層面的分析,從商業(yè)的角度來看,大模型能掙到上一代AI掙不到的錢。小冰公司CEO李笛認為,以前行業(yè)靠粗放式的API調用和Traffic的模式,賺到的錢基本就是成本。比如為媒體生成稿件,撰稿人原來每篇是1500元,但API調用,一家媒體可能每月只支付幾百塊,最后整個市場不過大幾十萬。

還有最近很火的游戲公司用生成式AI做美術資源,可以為游戲公司節(jié)省幾百萬上千萬的成本,但他們愿意為專門私有化部署的模型支付價格大概也就10萬人民幣左右。李笛甚至現(xiàn)身說法,目前在汽車智能座艙領域,小冰的市占率很高,但按調用次數(shù)付費,卻連研發(fā)成本都收不回來。

而大模型的創(chuàng)造力,可能帶來AI商業(yè)模式上的改變,比如去年年底開始,小冰公司和網(wǎng)飛聯(lián)合打造了幫助動漫工作室端到端生成視頻作品的平臺。如果按照傳統(tǒng)的商業(yè)模式,一次性技術開發(fā)的收費大概不到30萬人民幣,但一部《人和狗》的3分鐘短片,就為小冰公司獲得了15萬美元的回報。

目前大模型在移動互聯(lián)網(wǎng)領域,不斷有應用落地,在企業(yè)級應用,也有新的探索,未來在傳統(tǒng)產業(yè)呢?大模型還有近乎無限的應用可能,比如,科學家們認為,大模型已經類似于人腦,那如果我們給它外接上攝像頭,它是不是就有眼睛了?如果再加上手臂甚至翅膀呢?隨著深層次人工智能不斷落地和普及,新的改變還將會不斷發(fā)生。

02.螞蟻大模型

回到文章開頭,螞蟻投入到人工智能的研發(fā)差不多有10年的時間,本身就有非常豐富的AI業(yè)務場景,投入方向主要是降本增效和提升用戶體驗。目前,大模型應用的一個難題是喜歡“胡說八道”,因此,在應用到行業(yè)上時,尤其是金融這樣追求嚴謹?shù)男袠I(yè),廠商會格外慎重。

“通用大模型無法在專業(yè)嚴謹?shù)念I域直接商用,特別是金融服務對錯誤的容忍度很低,金融大模型要確保領域知識和專業(yè)邏輯的嚴謹性,才能真正落地帶來產業(yè)價值。知識力、專業(yè)力、語言力以及安全力,保障四大能力是前提條件,也是金融大模型要解的產業(yè)真命題。”螞蟻集團副總裁、金融大模型負責人王曉航在活動中介紹道。

不過,這并不意味著就忽視基礎大模型。螞蟻集團副總裁徐鵬在演講中介紹,螞蟻的大模型體系里,最核心的依舊是基礎大模型,而且包括語言大模型和多模態(tài)大模型。螞蟻的基礎大語言模型也是基于Transformer架構,但采取了跟ChatGPT不一樣的Prefix模型結構?;A多模態(tài)大模型主要的特色是大語言模型和圖文模型進行橋接,原生支持中文、融合文本圖像形態(tài),對齊其語義信息,支持多媒體內容理解和搜索推介,對于圖像的編輯和生成等。

在此之上,再在不同的領域,包括安全、金融、服務等,建設行業(yè)模型,通過行業(yè)模型實現(xiàn)產品的落地。

螞蟻建設了模型數(shù)據(jù)體系,包括在互聯(lián)網(wǎng)上通過機器進行大量數(shù)據(jù)的采集加工,通過高效用工管理和內容標注平臺產生高質量的數(shù)據(jù),來給模型進行精調,進一步人工強化學習等。螞蟻自研了精調框架和強化學習框架,還有智能分布式訓練引擎和高效分布式的推理引擎,再之上有開放的研發(fā)范式,支持螞蟻內部各業(yè)務對于大模型的需求。

從長遠上來看,螞蟻希望推動大模型規(guī)模化的產業(yè)落地,為此,初步的目標是提升AIGC模型研發(fā)的效能和技術的先進性,建設一個可持續(xù)發(fā)展的AIGC模型的研發(fā)范式,一個開發(fā)共贏的應用生態(tài),包括建設一流的基礎模型、行業(yè)模型,實現(xiàn)To C、To B的產品落地。

總結一下,就是從基礎大模型到行業(yè)大模型、再到產業(yè)應用的全棧布局。

圖片來源:外灘大會

以金融大模型為例,螞蟻金融大模型就是基于螞蟻基礎大模型,針對金融產業(yè)深度定制。螞蟻基礎大模型平臺具備萬卡異構集群,其中千卡規(guī)模訓練MFU可達到40%,集群有效訓練時長占比90%以上,RLHF訓練在同等模型效果下訓練吞吐性能相較于業(yè)界方案提升3.59倍,推理性能相較于業(yè)界方案提升約2倍。

目前“大模型+知識+服務”的架構已經在螞蟻內部金融智能化場景上內測,理財側的專業(yè)服務包括理財選品、產品評測、行情解讀、資產配置等6大類服務,保險側的專業(yè)服務包括產品解讀、家庭配置、智能核保、智能理賠等10多個智能服務。基于金融大模型,還有更貼近個人用戶的“支小寶2.0”和“支小助1.0”,提供便捷且豐富的服務 。

大模型的迅速崛起和繁榮,不僅是AI發(fā)展前沿熱點,也加速了人工智能與各行業(yè)深度融合,更強大、更通用、更開放的大模型,還有新算法、新應用、新場景不斷涌現(xiàn),正成為產業(yè)增長的新引擎和投資創(chuàng)業(yè)的新風口。不過,大模型也遇到了一系列的問題和挑戰(zhàn),比如算力能耗、中文公開數(shù)據(jù)集語料不足、大模型應用安全等,這條路不只是雪厚坡陡,也是道阻且長。

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2023-09-10
外灘掀起了“AI熱”
螞蟻入局大模型

長按掃碼 閱讀全文