大咖共探AGI時(shí)代機(jī)遇,騰訊云助力大模型規(guī)模化應(yīng)用提速

2023年,科技圈的“頂流”莫過于大模型。自ChatGPT的問世拉開大模型與生成式AI產(chǎn)業(yè)的發(fā)展序幕后,國內(nèi)大模型快速跟進(jìn),已完成從技術(shù)到產(chǎn)品、再到商業(yè)的階段跨越,并深入垂直行業(yè)領(lǐng)域。

新技術(shù)的爆發(fā),催生新的應(yīng)用場(chǎng)景與產(chǎn)品模式,撬動(dòng)影響全行業(yè)的智能化變革。滾滾趨勢(shì)下,作為從業(yè)者、創(chuàng)業(yè)者,將面對(duì)怎樣的機(jī)遇和挑戰(zhàn),又該如何破局迎來AGI新時(shí)代?

近日,「大模型時(shí)代的機(jī)遇與挑戰(zhàn)」騰訊云TVP AI創(chuàng)變研討會(huì)在上海騰云大廈舉行,特邀 AI 領(lǐng)域頂級(jí)大咖,圍繞大模型熱點(diǎn)話題進(jìn)行深度分享與研討,共同探索大模型時(shí)代的未來風(fēng)向。大模型——技術(shù)、價(jià)值、生態(tài)

IDEA研究院認(rèn)知計(jì)算與自然語言研究中心講席科學(xué)家、騰訊云TVP 張家興老師,帶來《大模型——技術(shù)、價(jià)值、生態(tài)》主題分享。

談及GPT大模型誕生的歷程,張家興老師從十余年在深度學(xué)習(xí)領(lǐng)域的資深研究經(jīng)驗(yàn)出發(fā),用模型結(jié)構(gòu)、訓(xùn)練技術(shù)、算力+系統(tǒng)和數(shù)據(jù)四條主線來闡述整個(gè)技術(shù)發(fā)展的背后趨勢(shì),并重點(diǎn)分享了幾個(gè)關(guān)鍵節(jié)點(diǎn):

● 模型結(jié)構(gòu)創(chuàng)新:深度學(xué)習(xí)的興起推動(dòng)了模型結(jié)構(gòu)的創(chuàng)新,其中Transformer結(jié)構(gòu)起到了關(guān)鍵作用。它突破了模型1億參數(shù)的瓶頸,統(tǒng)一了各種注意力機(jī)制的嘗試方法,也解決了任務(wù)設(shè)計(jì)的難題;

● 訓(xùn)練技術(shù)突破:標(biāo)志性事件是2018年BERT模型,張家興老師認(rèn)為模型結(jié)構(gòu)是物理基礎(chǔ),而訓(xùn)練技術(shù)使得人工智能具備特定能力;

● 算力與數(shù)據(jù)的進(jìn)步:底層的芯片不斷進(jìn)步,性能提升了100倍以上。

張家興老師指出,任何一次大的技術(shù)范式的變化,都是一次類型的消失,或者都是一種走向統(tǒng)一的過程,大模型就是這樣的一種新的技術(shù)范式變化。在ChatGPT 出現(xiàn)后,模型結(jié)構(gòu)走向統(tǒng)一,之后就會(huì)快速“分歧”,整個(gè)技術(shù)領(lǐng)域重新分工,促使新的生產(chǎn)鏈的形成,這種變化標(biāo)志著大模型將成為一個(gè)新的產(chǎn)業(yè)。

在整個(gè)技術(shù)的范式變化過程中,張家興老師所帶領(lǐng)團(tuán)隊(duì)研發(fā)的模型方向也在變化,從一開始的封神榜,到如今構(gòu)建姜子牙系列專家大模型。張家興老師分析到,構(gòu)建一個(gè)全能力的大模型存在一定挑戰(zhàn),不同能力之間可能存在沖突和不兼容性,因此將各個(gè)能力拆分成獨(dú)立的模型,以便能夠?qū)W⒂诿總€(gè)能力的發(fā)展。通過定制針對(duì)性的訓(xùn)練策略,從而達(dá)到每個(gè)能力的最佳表現(xiàn)。

張家興老師認(rèn)為,在“百模大戰(zhàn)”的競(jìng)爭(zhēng)格局中,訓(xùn)練技術(shù)的探索性極為重要。他強(qiáng)調(diào),訓(xùn)練技術(shù)本身即是一個(gè)探索的過程。在訓(xùn)練過程中探索好的生成方式,并在人類反饋學(xué)習(xí)中引導(dǎo)模型的發(fā)展。

在大模型應(yīng)用產(chǎn)品方面。張家興老師提出從專家模型到客戶端進(jìn)行層層封裝的思路:

第一層封裝是一體化封裝:包括代碼模型及微調(diào)、應(yīng)用和高效推理工具等,并設(shè)置好各種使用場(chǎng)景;

第二層封裝是模型和算力整合封裝:張家興老師在這一方面正在和騰訊云展開合作,積極推進(jìn)將模型和算力結(jié)合在一個(gè)大模型產(chǎn)品中提供給客戶,做到“開箱即用”。 AGI時(shí)代的技術(shù)創(chuàng)新范式與思考

Boolan首席技術(shù)專家、全球機(jī)器學(xué)習(xí)技術(shù)大會(huì)主席、騰訊云TVP 李建忠老師,帶來了題為《AGI時(shí)代的技術(shù)創(chuàng)新范式與思考》的主題演講。

李建忠老師首先從產(chǎn)業(yè)的角度對(duì)技術(shù)的發(fā)展進(jìn)行了時(shí)間線的梳理,他認(rèn)為連接和計(jì)算都經(jīng)歷了從1.0到2.0的革命性變化。1840-1940年的這100年間是連接的1.0時(shí)代,電報(bào)之后電話、廣播、電視相繼誕生,是最早的連接技術(shù)。1946年第一代計(jì)算機(jī)出現(xiàn),而后大型機(jī)、小型機(jī)、微型機(jī)、PC出現(xiàn),這是計(jì)算的1.0時(shí)代。之后隨著1995年互聯(lián)網(wǎng)出現(xiàn)后,Web2.0、移動(dòng)互聯(lián)網(wǎng)、云服務(wù)問世,這是連接2.0時(shí)代,相比上一代,連接從單向走向雙向。再到2017年Transformer結(jié)構(gòu)的出現(xiàn),GPT的迭代是計(jì)算2.0時(shí)代,這個(gè)時(shí)代還將繼續(xù),李建忠老師認(rèn)為按照過往技術(shù)發(fā)展的曲線,這個(gè)時(shí)間會(huì)持續(xù)到2035年左右。

同時(shí),李建忠老師分析指出,在技術(shù)的發(fā)展過程中,呈現(xiàn)出一種連接和計(jì)算的“鐘擺”狀態(tài)。而這兩者之間的關(guān)系,他認(rèn)為連接解決的是生產(chǎn)關(guān)系,而計(jì)算解決的是生產(chǎn)力的問題。連接模式的邏輯是提供信息供用戶決策,是廣告天然的土壤;而計(jì)算模式的邏輯是要用戶向機(jī)器提供數(shù)據(jù)來幫助決策,其商業(yè)模式更趨向收費(fèi)。在計(jì)算邏輯下,效率優(yōu)先,結(jié)果至上。

李建忠老師提出了范式轉(zhuǎn)換的“立方體”模型,在該模型中X軸代表人類需求,如信息、娛樂、搜索、社交、商業(yè);Y軸代表技術(shù)平臺(tái),即連接1.0、計(jì)算1.0、連接2.0、計(jì)算2.0;Z軸代表媒介交互,如文字、圖片、音頻、視頻、三維等。他認(rèn)為需求和技術(shù)的交叉點(diǎn)是創(chuàng)新的關(guān)鍵,同時(shí)強(qiáng)調(diào)媒介的變化對(duì)于產(chǎn)品和創(chuàng)新的影響。在智能時(shí)代,填充不同象限代表對(duì)應(yīng)不同方向,比如大模型與不同領(lǐng)域結(jié)合,為其創(chuàng)新和產(chǎn)品發(fā)展提供新的思路。

基于此,李建忠老師總結(jié)了大模型具備四大核心能力:

● 生成模型:是其最成熟和最強(qiáng)大的部分,能夠生成各種內(nèi)容;

● 知識(shí)抽象:壓縮人類知識(shí),為知識(shí)密集型行業(yè)帶來革新;

● 語言交互:是人機(jī)對(duì)話的核心,有巨大的想象空間;

● 邏輯推理:具備邏輯、規(guī)劃、記憶能力,成為具身智能。

以大模型核心能力為支點(diǎn)與不同領(lǐng)域結(jié)合會(huì)帶來怎樣的創(chuàng)新機(jī)會(huì)?李建忠老師以大模型應(yīng)用層為切入點(diǎn)提出兩個(gè)主要方向:AI-Native和AI-Copilot。AI-Native是指完全融入AI的新型產(chǎn)品或服務(wù),高風(fēng)險(xiǎn)高回報(bào)。AI-Copilot則是以漸進(jìn)增強(qiáng)的方式,將AI能力嵌入現(xiàn)有的商業(yè)閉環(huán)中,并與現(xiàn)有的基礎(chǔ)設(shè)施兼容和擴(kuò)展。

同樣,在軟件領(lǐng)域,李建忠老師分享了大模型為軟件開發(fā)帶來的三大范式轉(zhuǎn)換:

● 開發(fā)范式:大模型將改變代碼編寫方式,從工程師寫代碼為主到AIGC生成代碼為主;

● 交互范式:從圖形交互界面(GUI)轉(zhuǎn)為自然語言交互界面(NUI),包括NUI+GUI協(xié)同、渠道結(jié)構(gòu)化輸入中間環(huán)節(jié)的變革,以及拆除孤立應(yīng)用間的壁壘,實(shí)現(xiàn)應(yīng)用和服務(wù)的無縫集成;

● 交付范式:即用戶共創(chuàng)可塑軟件,這種開放性將使軟件的功能范圍變得更為廣泛。

李建忠老師認(rèn)為,在未來的三到五年內(nèi),整個(gè)AGI產(chǎn)業(yè)的成熟度將達(dá)到一個(gè)新的高度,帶來巨大的創(chuàng)新機(jī)會(huì)。 利用無處不在的硬件算力和開放軟件解鎖生成式人工智能

英特爾院士、大數(shù)據(jù)技術(shù)全球CTO、騰訊云TVP 戴金權(quán)老師,帶來《利用無處不在的硬件算力和開放軟件解鎖生成式人工智能》主題分享。

戴金權(quán)老師首先分享了英特爾團(tuán)隊(duì)在生成式人工智能領(lǐng)域的工作。他提到,影響生成式AI的眾多因素中,算力是非常重要的支撐因素,英特爾針對(duì)端到端的AI的流水線如何提升效率、如何對(duì)AI加速進(jìn)行了針對(duì)性的優(yōu)化。

通過軟硬件結(jié)合,英特爾成功提高了AI深度學(xué)習(xí)的速度,甚至可以實(shí)現(xiàn)免費(fèi)的軟件AI加速器;在生成式AI計(jì)算加速方面,戴金權(quán)老師提到數(shù)據(jù)中心端是重點(diǎn),它將有力支持大模型的訓(xùn)練和超大規(guī)模推理。

在英特爾最近發(fā)布的Gaudi2深度學(xué)習(xí)加速器中,與Hugging Face合作進(jìn)行模型優(yōu)化。同時(shí),英特爾在服務(wù)器上加入了Intel AMX,其由兩部分組成:一個(gè)是2D的寄存器文件,另一個(gè)是矩陣加速支持。戴金權(quán)老師提到,這樣做的好處在于能夠在通用CPU的服務(wù)器上實(shí)現(xiàn)硬件加速的能力,在通用計(jì)算的場(chǎng)景下具有一定意義。

針對(duì)云端存儲(chǔ)的用戶數(shù)據(jù)和私有化部署的大模型如何保障安全不泄漏的行業(yè)需求,戴金權(quán)老師分享到,通過硬件保護(hù)和軟件安全技術(shù),可實(shí)現(xiàn)全鏈路的隱私保護(hù),確保數(shù)據(jù)和模型在計(jì)算過程中對(duì)其他用戶不可見,只在硬件保護(hù)的環(huán)境中進(jìn)行計(jì)算,既保證了安全,又接近明文計(jì)算的效率。

為實(shí)現(xiàn)AI無所不在的愿景,近期英特爾開源了基于INT4在 Intel CPU上的大模型推理庫,支持在英特爾上跑超過百億參數(shù)的大模型,戴金權(quán)老師介紹并演示了其功能特性:

● 支持INT3、INT4、NF4、INT8等多種技術(shù);

● 技術(shù)易于使用和遷移,可以加速任何基于PyTorch的大模型,并實(shí)現(xiàn)高效優(yōu)化;

● 兼容社區(qū)常用的API;一兩行代碼即可遷移現(xiàn)有應(yīng)用。

最后,戴金權(quán)老師表達(dá)了他對(duì)于大模型應(yīng)用在從PC無縫擴(kuò)展到GPU到云這一未來趨勢(shì)的期待,這一新的應(yīng)用場(chǎng)景值得大家共同去探索。 面向大模型,如何打造云上最強(qiáng)算力集群

騰訊云高性能計(jì)算研發(fā)負(fù)責(zé)人 戚元覲老師,帶來《面向大模型,如何打造云上最強(qiáng)算力集群》的主題分享。

首先,戚元覲老師對(duì)深度學(xué)習(xí)與AI分布式訓(xùn)練進(jìn)行了介紹。他提到為了解決大模型訓(xùn)練中語料數(shù)據(jù)集過大和模型參數(shù)劇增的問題,需要采用分布式計(jì)算。就此,戚元覲老師分享了當(dāng)下大模型訓(xùn)練中的一些分布式計(jì)算方案:

● 數(shù)據(jù)并行:按照模型的數(shù)據(jù)集切分并發(fā)送到各個(gè)GPU上進(jìn)行計(jì)算,每個(gè)GPU分別計(jì)算自己的梯度,再進(jìn)行全局同步以更新模型參數(shù);

● 模型并行-流水線并行:按照模型的層級(jí)進(jìn)行切分,不同部分將分配到不同的GPU上進(jìn)行計(jì)算,進(jìn)行梯度計(jì)算和傳遞;

● 模型并行-張量并行:對(duì)模型進(jìn)行更細(xì)粒度的切分,將模型的參數(shù)權(quán)重進(jìn)行橫向或縱向的切分;

此外,還有如專家并行,由各個(gè)專家系統(tǒng)組成并路由到不同的系統(tǒng)中進(jìn)行計(jì)算。

戚元覲老師提到,分布式計(jì)算可以充分利用多個(gè)GPU的計(jì)算資源,加快訓(xùn)練速度,并解決單個(gè)GPU內(nèi)存不足的問題。不同的方法適用于不同的場(chǎng)景和模型結(jié)構(gòu),選擇合適的并行策略可以提升訓(xùn)練效率和性能。

分布式訓(xùn)練方法對(duì)網(wǎng)絡(luò)通信有較高的要求,業(yè)內(nèi)大都采用3D并行方式,特別是在3D并行的場(chǎng)景下,帶寬需求對(duì)于吞吐量是敏感的。在訓(xùn)練中,想要不讓網(wǎng)絡(luò)成為計(jì)算的瓶頸,機(jī)器與機(jī)器之間的通信帶寬需要達(dá)到1.6Tbps。

為了應(yīng)對(duì)以上挑戰(zhàn),騰訊云推出了AI算力底座——高性能計(jì)算集群HCC,可廣泛應(yīng)用于大模型、自動(dòng)駕駛、商業(yè)推薦系統(tǒng)、圖像識(shí)別等人工智能模型訓(xùn)練場(chǎng)景,其具有以下特性優(yōu)勢(shì):

● 搭配高性能GPU:提供強(qiáng)大算力;

● 低延時(shí)RDMA網(wǎng)絡(luò):節(jié)點(diǎn)互聯(lián)網(wǎng)絡(luò)低至2us,帶寬支持1.6Tbps-3.2Tbps;

● GpuDirect RDMA:GPU計(jì)算數(shù)據(jù)無需繞行,跨機(jī)點(diǎn)對(duì)點(diǎn)直連;

● TACO訓(xùn)練加速套件:一鍵提升人工智能訓(xùn)練性能。

騰訊云首發(fā)的H800計(jì)算集群采用多軌道的流量架構(gòu),能夠大大減少不必要的數(shù)據(jù)傳輸,提升網(wǎng)絡(luò)性能,在業(yè)界處于領(lǐng)先地位。

除了硬件支持外,騰訊云還提供了自研的集合通信庫TCCL,得益于自研的交換機(jī)架構(gòu),TCCL實(shí)現(xiàn)了端網(wǎng)協(xié)同,解決流量負(fù)載不均的問題,可以在雙網(wǎng)口環(huán)境下提升流量約40%。同時(shí)提供拓?fù)涓兄H和性調(diào)度功能,旨在最小化流量繞行。它具有動(dòng)態(tài)感知能力,可根據(jù)最優(yōu)順序進(jìn)行任務(wù)分配,避免通信數(shù)據(jù)擁堵。

戚元覲老師提到,騰訊云的方案都采用雙上聯(lián)的網(wǎng)絡(luò)設(shè)計(jì)結(jié)構(gòu),相比單口訓(xùn)練的可用性更高。數(shù)據(jù)存儲(chǔ)方面,騰訊云提供了Turbo CF5文件存儲(chǔ)方案和COS方案,通過多級(jí)加速提升數(shù)據(jù)訪問性能。

同時(shí),為提高用戶的算力使用率,騰訊云推出了TACO Kit加速套件,通過對(duì)內(nèi)存和顯存的統(tǒng)一管理,減少數(shù)據(jù)的來回搬移,加快參數(shù)更新的速度;還有TACO lnfer推理加速,讓支持推理透明、加速,帶給用戶更好的體驗(yàn)服務(wù)。

戚元覲老師總結(jié)到,騰訊云高性能計(jì)算集群HCC方案能夠從數(shù)據(jù)讀取、訓(xùn)練計(jì)算、網(wǎng)絡(luò)交換等多個(gè)層面助力用戶又快又持續(xù)地完成每一個(gè)訓(xùn)練任務(wù),為用戶云上訓(xùn)練提供完整的流程支持。 探討辯論環(huán)節(jié)

主題分享結(jié)束后,主持人中國信通院低代碼/無代碼推進(jìn)中心技術(shù)專家、騰訊云TVP 沈欣老師做了精彩的總結(jié),他提到大模型的發(fā)展所帶來最核心和關(guān)鍵的影響是生產(chǎn)關(guān)系的變化。如“程序員是否會(huì)消失”這個(gè)問題,可以將程序員比喻成馬車時(shí)代趕馬的人,現(xiàn)在還會(huì)有養(yǎng)馬的人,但是他們已經(jīng)被開車的人淘汰了。軟件開發(fā)行業(yè)將被AI重塑,這是未來的程序員所將面對(duì)的迭代和變化挑戰(zhàn)。

隨后,迎來了火花迸發(fā)的探討辯論環(huán)節(jié)。主持人沈欣老師提出了頗具深度的四個(gè)開放話題與兩個(gè)辯論題目,現(xiàn)場(chǎng)嘉賓以小組形式,對(duì)各個(gè)話題展開了充分的討論,在熱烈的交流與辯論中碰撞出眾多精彩的觀點(diǎn)。

話題1:隨著大模型的發(fā)展,未來將會(huì)形成怎樣的AI生態(tài),會(huì)如何影響IT行業(yè)的格局?

來自第二組的發(fā)言代表,盛派網(wǎng)絡(luò)創(chuàng)始人兼首席架構(gòu)師、騰訊云TVP 蘇震巍老師提出,AI未來將重塑整個(gè)軟件行業(yè)的生態(tài)及商業(yè)模式,包括現(xiàn)在軟件應(yīng)用的形態(tài)、互聯(lián)網(wǎng)運(yùn)行的模式、用戶付費(fèi)的方式等等。同時(shí)隨著AI進(jìn)一步推動(dòng)生產(chǎn)力發(fā)展,可以預(yù)見未來企業(yè)對(duì)人員的需求將發(fā)生極大的改變,程序員將在一定程度上減少。

蘇震巍老師進(jìn)一步總結(jié)到,AI會(huì)在三大方面影響我們未來的商業(yè)和工作:AI推動(dòng)生產(chǎn)效率變革,影響生產(chǎn)力和生產(chǎn)關(guān)系的變化;獲取知識(shí)和使用知識(shí)的方式改變,效率提升;AI會(huì)成為資產(chǎn)的一部分,數(shù)據(jù)確權(quán)等問題值得關(guān)注。

話題2:AI算力的私有化部署和云部署有哪些差異和優(yōu)勢(shì),分別更適合哪些場(chǎng)景?

第三組的發(fā)言代表,美團(tuán)金融服務(wù)平臺(tái)研究員、騰訊云TVP 丁雪豐老師,從成本、安全性和靈活性三個(gè)視角對(duì)AI算力的私有化部署和云部署進(jìn)行了比較。

● 從成本角度看:云部署對(duì)于中小企業(yè)而言,無論在硬件投入還是維護(hù)方面都更符合當(dāng)下企業(yè)的降本增效需求;

● 從安全性角度看:他認(rèn)為部分行業(yè),如金融行業(yè)的的安全性和合規(guī)性要求極高,私有化部署更為適用;

● 從靈活性角度看:公有云不僅可以單純地按需提供算力,對(duì)于成熟的場(chǎng)景也能提供一站式解決方案,用戶可以根據(jù)實(shí)際需求選擇合適的使用方式,在滿足安全與合規(guī)的場(chǎng)景下更推薦選擇云部署。

話題3:企業(yè)應(yīng)如何衡量AI的價(jià)值,如何量化成本結(jié)構(gòu)和價(jià)值,在不同的業(yè)務(wù)有哪些案例?

來自第四組的發(fā)言代表,騰訊云TVP 徐巍老師提出以下五個(gè)評(píng)估維度:是否為企業(yè)創(chuàng)造價(jià)值、節(jié)約成本、提升企業(yè)生產(chǎn)力、提升客戶滿意度,以及助力業(yè)務(wù)增長(zhǎng)。徐巍老師補(bǔ)充到,不同企業(yè)和行業(yè)面臨的挑戰(zhàn)和目標(biāo)也各不相同,因此評(píng)估AI的價(jià)值需要結(jié)合其具體情況和目標(biāo)進(jìn)行綜合考量。

同時(shí),就ToB和ToC的業(yè)務(wù)場(chǎng)景而言,在ToB領(lǐng)域,智能客服、數(shù)字人、AI知識(shí)庫和企業(yè)培訓(xùn)等已經(jīng)被許多企業(yè)應(yīng)用;在ToC領(lǐng)域,當(dāng)下AI生成等是主流的應(yīng)用場(chǎng)景。

談及AI的成本構(gòu)成,徐巍老師認(rèn)為當(dāng)下主要包括算力成本、AI技術(shù)的開發(fā)和維護(hù)成本,以及AI產(chǎn)品的運(yùn)營和推廣成本。

話題4:在大模型的熱潮下,大公司和創(chuàng)業(yè)公司分別有哪些可以切入的創(chuàng)新機(jī)遇?

第一組的發(fā)言代表,Boolan首席技術(shù)專家、全球機(jī)器學(xué)習(xí)技術(shù)大會(huì)主席、騰訊云TVP 李建忠老師認(rèn)為從數(shù)據(jù)的優(yōu)勢(shì)角度看,當(dāng)下AI領(lǐng)域的創(chuàng)新對(duì)大公司或成熟的公司友好,但從開源的角度來看,他認(rèn)為對(duì)創(chuàng)業(yè)公司更友好。

李建忠老師以產(chǎn)品的發(fā)展模式展開闡述,AI-Native的模式更適合創(chuàng)業(yè)型公司,因?yàn)槊鎸?duì)新事物的到來它們具備全新的起點(diǎn)和思維模式,而且一些創(chuàng)業(yè)公司的投入并不弱于大公司。

辯論題目1:未來大模型開源是主流or 閉源是主流?

第一組的發(fā)言代表,Boolan首席技術(shù)專家、全球機(jī)器學(xué)習(xí)技術(shù)大會(huì)主席、騰訊云TVP 李建忠老師是“開源方”,他首先定義了“主流”一詞:用戶最多就是主流;他認(rèn)為與閉源相比,開源可以實(shí)現(xiàn)邊緣層和模型層的良好標(biāo)準(zhǔn)化;同時(shí)開源能夠集合整個(gè)行業(yè)之力在一個(gè)點(diǎn)上進(jìn)行優(yōu)化,帶來更多的資源和投入;

隨后,來自第二組的發(fā)言代表,盛派網(wǎng)絡(luò)創(chuàng)始人兼首席架構(gòu)師、騰訊云TVP 蘇震巍老師作為“閉源方”先就“主流”定義進(jìn)行了反駁,他認(rèn)為真正能夠有影響力推動(dòng)整個(gè)行業(yè)變革,同時(shí)在商業(yè)上形成持久循環(huán)的,有更健康生態(tài)的才是主流,并以閉源的ChatGPT4為例進(jìn)行了論證。他強(qiáng)調(diào),大模型包含了模型本身和數(shù)據(jù)源,因此算法開源和成果的開源,并不就代表大模型的開源,并舉例了Lama2的各種限制。蘇震巍老師認(rèn)為當(dāng)前的一些所謂開源框架,被用作營銷工具,違背了開源的真正的精神。

之后“開源方”的李建忠老師進(jìn)行了針對(duì)性反駁,他首先糾正了對(duì)方的“開源營銷說”,強(qiáng)調(diào)開源是生態(tài)級(jí)的革命。同時(shí)就ChatGPT4的例子,他認(rèn)為其最初源頭是來自谷歌的開源,且OpenAI也在準(zhǔn)備開源中。

“閉源方”的蘇震巍老師隨后補(bǔ)充,不否認(rèn)開源的生態(tài)革命,但事實(shí)上很多開源是迫于競(jìng)爭(zhēng)壓力下的搶占市場(chǎng)份額的商業(yè)行為。同時(shí)他表示,知識(shí)的共享并不代表是開源。

辯論題目2:更看好通用大模型賽道or垂直大模型賽道?

第三組的發(fā)言代表,美團(tuán)金融服務(wù)平臺(tái)研究員、騰訊云TVP 丁雪豐老師更看好通用大模型賽道,他認(rèn)為從更大、更高的歷史觀視角看,通用大模型的發(fā)展是必然的,而且在應(yīng)用層可以避免垂直大模型的局限性。同時(shí)未來隨著通用大模型的學(xué)習(xí)范圍不斷拓展,當(dāng)前的垂直領(lǐng)域都將被覆蓋。

更看好垂直大模型賽道的第四組的發(fā)言代表,騰訊云TVP 徐巍老師則是從三個(gè)角度闡述他的觀點(diǎn):從商業(yè)模式看,垂直大模型有豐富的應(yīng)用場(chǎng)景,可落地,商業(yè)模式經(jīng)過驗(yàn)證是成立的;從成本角度看,大模型的算力成本極高,垂直大模型的成本更加可控;從數(shù)據(jù)角度來說,作為大模型訓(xùn)練極為重要的部分,通用大模型所需要的數(shù)據(jù)量巨大,數(shù)據(jù)源限制性高,垂直知識(shí)庫的可實(shí)現(xiàn)性更高。

隨后“通用大模型”方的丁雪豐老師進(jìn)一步論述,通用大模型在當(dāng)前AI領(lǐng)域的重要性不言而喻,它提供了技術(shù)基座,為各種應(yīng)用提供了支持;而且,基礎(chǔ)的、通用的能力發(fā)展是自主可控的必然要求。

“垂直大模型”方的徐巍老師做了最后的補(bǔ)充,他認(rèn)為從賽道生態(tài)角度來看,垂直大模型賽道的玩家更多,更能形成百花齊放的生態(tài),帶來更高的商業(yè)價(jià)值和社會(huì)價(jià)值。 結(jié)語

本次研討會(huì)的探討與辯論話題沒有確定的答案,大模型發(fā)展方興未艾,將為每一個(gè)技術(shù)從業(yè)者、企業(yè)和行業(yè)都帶來新的影響。本次活動(dòng)已圓滿落下帷幕,但騰訊云TVP專家們對(duì)于技術(shù)的探索還將繼續(xù),他們秉持著“用科技影響世界”的初心和愿景,持續(xù)以創(chuàng)新之心積極擁抱大模型時(shí)代的變革與趨勢(shì),以敬畏之意理性迎接未來的機(jī)遇和挑戰(zhàn)。

TVP,即騰訊云最具價(jià)值專家(Tencent Cloud Valuable Professional),是騰訊云授予云計(jì)算領(lǐng)域技術(shù)專家的一個(gè)獎(jiǎng)項(xiàng)。TVP致力打造與行業(yè)技術(shù)專家的交流平臺(tái),促進(jìn)騰訊云與技術(shù)專家和用戶之間的有效溝通,從而構(gòu)建云計(jì)算技術(shù)生態(tài),實(shí)現(xiàn)“用科技影響世界”的美好愿景。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )