中國大模型的落地DNA,寫在這個雙螺旋結(jié)構(gòu)里

隨著大模型的飛速發(fā)展,行業(yè)各界對大模型的核心疑問,已經(jīng)從“有沒有大模型”,轉(zhuǎn)變?yōu)榉e極投入建設(shè)之后,中國AI產(chǎn)業(yè)如何實現(xiàn)大模型落地?巨大的建設(shè)投資應(yīng)該如何獲得確定性、可持續(xù)的回報?

事實上,中國AI最強的特征一直是落地。

技術(shù)落地的一個重要指標是技術(shù)密度,即一項技術(shù)在社會和經(jīng)濟中的普及程度和應(yīng)用密度。過去幾年里,AI技術(shù)已經(jīng)在中國的農(nóng)田、工廠、港口、礦山、校園、城市等遍地開花,是全球其他地區(qū)都極少見到的景象。

產(chǎn)業(yè)革命的發(fā)生不可能一蹴而就,擁有大量業(yè)務(wù)場景和AI落地經(jīng)驗的中國,也應(yīng)該是大模型落地的前哨站。

果不其然,外界對中國AI和大模型落地的疑問與好奇,已經(jīng)可以在文心的最新進展中,得到解答。

7月6日,在2023世界人工智能大會(WAIC)上,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰,解讀文心大模型3.5版核心技術(shù),同時發(fā)布了飛槳生態(tài)最新進展,首次披露了飛槳深度學(xué)習(xí)平臺最新數(shù)據(jù),闡述人工智能產(chǎn)業(yè)模式。

文心和飛槳的協(xié)同發(fā)展,組成了一個雙螺旋結(jié)構(gòu),讀懂這個DNA 片段,可以更清晰地理解中國AI技術(shù)持續(xù)走向落地的方法與路徑。

一、產(chǎn)業(yè)AI的無形之墻

一個技術(shù)走向產(chǎn)業(yè),有三個因素構(gòu)成了影響其市場格局的制約點:一是技術(shù)領(lǐng)先性,二是市場需求度,三是產(chǎn)品可靠與可用程度。

大模型技術(shù)的領(lǐng)先性和市場需求度,自然毋庸置疑,那么產(chǎn)品能否經(jīng)受得住產(chǎn)業(yè)用戶的考驗?zāi)??中國AI場景多、落地早、實踐多,所以已經(jīng)可以清晰地看到一堵產(chǎn)業(yè)AI的無形之墻,各行各業(yè)普遍存在的“三高”要求,是大模型落地所必須跨越的挑戰(zhàn):

能力要求高。一些IT基礎(chǔ)好的產(chǎn)業(yè)會率先應(yīng)用AI、落地大模型,但這些領(lǐng)域往往有著復(fù)雜的業(yè)務(wù)場景,以及使用多年的傳統(tǒng)算法,因此產(chǎn)業(yè)對AI大模型的基礎(chǔ)能力,要求會比較苛刻,超出現(xiàn)有技術(shù)手段,才有升級替換的必要性。

專業(yè)性要求高。通用大模型進入垂直細分的業(yè)務(wù)場景,會面臨非常復(fù)雜的業(yè)務(wù)狀況,要注意哪些問題和細節(jié),需要哪些數(shù)據(jù),目標是什么,需要大模型能夠像行業(yè)專家一樣,掌握專有知識和行業(yè)Know-How。

開發(fā)成本高。行業(yè)場景的龐雜和差異化廣泛,大模型落地需要有針對性的訓(xùn)練、精調(diào),而很多行業(yè)和企業(yè)缺乏充足的IT人才、算力資源等來進行定制開發(fā),延緩了大模型落地的速度。

“三高”要求制約著AI技術(shù)落地,這也使得大模型走向產(chǎn)業(yè),還處于初級階段。

二、中國大模型的強落地范本

鑿穿產(chǎn)業(yè)AI 的圍墻,需要筑重器。在世界人工智能大會上,王海峰分享了文心大模型3.5的核心技術(shù)創(chuàng)新。

與文心大模型3.0版本相比,文心大模型3.5版本在效果、功能、性能上全面提升,實現(xiàn)了基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強等能力升級。

更值得關(guān)注的是,文心大模型在應(yīng)用層面,展現(xiàn)出了掙脫制約、指向落地的一系列方法,可以成為產(chǎn)業(yè)示范。

文心大模型3.5的幾大技術(shù)創(chuàng)新,就滿足了產(chǎn)業(yè)各界對大模型的三種強期待:

一是對先進生產(chǎn)力的期待。

歸根結(jié)底,大模型要可靠、可用,為行業(yè)提質(zhì)增效。文心大模型3.5的兩大升級點,就著眼于此:

首先,基礎(chǔ)模型升級,基于飛槳加快模型迭代,提升模型效果和安全性,模同時,百度文心大模型研發(fā)團隊創(chuàng)新了多類型多階段有監(jiān)督精調(diào)、多層次多粒度獎勵模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù),使模型效果及場景適配能力進一步提升。

此外,文心大模型3.5的邏輯推理提升,在語義理解、數(shù)學(xué)計算、代碼生成等領(lǐng)域表現(xiàn)更好,這些任務(wù)是實際業(yè)務(wù)中高頻出現(xiàn)的。王海峰舉了個例子,百度每天有大量工程師在寫代碼,文心一言發(fā)揮大模型的代碼生成能力,可以更好地幫助工程師提升寫代碼的效率,切實提高生產(chǎn)力。

二是對行業(yè)專家的期待。

大模型需要與行業(yè)場景適配,解決業(yè)務(wù)中更具專業(yè)性的實際問題,已經(jīng)成為共識。此次3.5版本,就通過“精調(diào)”+“知識點增強”兩大技術(shù)創(chuàng)新,讓大模型具備行業(yè)專家一樣的專精能力。

有監(jiān)督的精調(diào)技術(shù),可以針對性地適配業(yè)務(wù)場景,讓結(jié)果更加可靠,從而更好地滿足業(yè)務(wù)場景對模型效果和安全性的需求。知識點增強技術(shù),則在此前的知識增強和檢索增強的基礎(chǔ)上,為大模型注入更具體、更詳細、更專業(yè)的知識點,顯著提升大模型對世界知識的掌握和運用,更好地完成專業(yè)任務(wù)。比如在生成報告時,文心大模型就能夠?qū)τ脩糨斎氲牟樵儭栴}等進行分析理解,并解析生成答案所需要的相關(guān)知識點,生成更匹配業(yè)務(wù)特點的內(nèi)容。

三是對豐富應(yīng)用的期待。

智能手機中豐富多彩的應(yīng)用,是移動互聯(lián)網(wǎng)產(chǎn)業(yè)繁榮的前提。用戶使用大模型也需要多樣、豐富、易用的各種應(yīng)用工具,這就需要插件機制來滿足。

文心大模型3.5新增的插件機制,可以擴展大模型的能力邊界,細致高效地應(yīng)用于各類場景。比如文心一言的長文本摘要和問答插件ChatFile,支持超長文本輸入,可以在辦公場景下,形成會議議題、摘要及總結(jié)等關(guān)鍵信息,幫助提升工作效率。

王海峰也表示,文心一言將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件,讓用戶能夠更好地應(yīng)用文心大模型,同時也將逐步開放插件生態(tài),幫助開發(fā)者基于文心大模型打造自己的應(yīng)用。

隨著大量優(yōu)秀的開發(fā)者和軟件工程師,基于文心大模型來打造專屬插件,不僅大模型的可用性和產(chǎn)業(yè)適配性會進一步提高,所帶來的應(yīng)用市場空間也是巨大的。

文心大模型3.5的升級曲線,緊密貼合產(chǎn)業(yè)期待。從中可以看到,文心大模型時刻準備著落地千行百業(yè)。

三、大模型落地需要可持續(xù)動力

僅有大模型還不夠,王海峰提出,在文心一言這類大模型產(chǎn)業(yè)落地的進程中,可以采用“集約化生產(chǎn),平臺化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)。

文心大模型能夠率先卡位在大模型落地的關(guān)鍵位置,離不開背后的另一條上升曲線:飛槳的聯(lián)合優(yōu)化。

飛槳對文心的全面賦能,有四個層面:

首先,飛槳支撐大模型開發(fā)、訓(xùn)練和推理部署,全面提升大模型落地效率。大模型的訓(xùn)練、迭代要消耗大量訓(xùn)練成本、訓(xùn)練時間,經(jīng)過飛槳與文心大模的協(xié)同優(yōu)化,最新升級的文心大模型3.5的模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。

其次,文心大模型成為飛槳模型庫的重要組成部分,通過飛槳平臺進行精調(diào)、推理部署,就可以有效支持千行百業(yè)的應(yīng)用,降低行業(yè)獲取大模型門檻。

再次,飛槳提供了全流程產(chǎn)業(yè)化工具與平臺,解決大模型開發(fā)中的卡點、堵點,比如模型體積大、訓(xùn)練難度高、算力消耗大等,更好地滿足企業(yè)開發(fā)應(yīng)用大模型的需求。

此外,大模型落地產(chǎn)業(yè)離不開人才,飛槳已經(jīng)凝聚了750萬開發(fā)者,也支持了大量企業(yè)產(chǎn)生了大量的模型,為中國AI培養(yǎng)了大量新型人才,是大模型落地的有生力量。

可以看到,飛槳的技術(shù)和生態(tài)積累,正在為文心大模型走向產(chǎn)業(yè),注入了源源不斷的動力。

四、中國AI,憑借這樣的DNA落地生根

在大會現(xiàn)場,王海峰也展現(xiàn)了文心一言在辦公、會議、編碼等場景的應(yīng)用??梢哉f,文心一言已經(jīng)有了豐富的新落地場景,這種強勁的落地表現(xiàn),應(yīng)該能夠打消外界對中國大模型可持續(xù)發(fā)展的擔(dān)憂。

從文心與飛槳組成了雙螺旋結(jié)構(gòu)的DNA,從中可以看出中國AI以實用為先,以產(chǎn)業(yè)為向的底色,中國大模型產(chǎn)業(yè)也開始呈現(xiàn)出這樣的發(fā)展趨勢:

1.低門檻。通過各個端口的技術(shù)創(chuàng)新,形成了AI技術(shù)全面低門檻化的特征,讓模型的開發(fā)、獲取和應(yīng)用,都更加便捷、易得。

2.高效率。芯片、框架、模型、應(yīng)用的全棧協(xié)同,帶來了效率持續(xù)增長的乘法效應(yīng),大大加快了模型的落地速度。

3.通行業(yè)。AI開發(fā)、訓(xùn)練、部署、應(yīng)用的全鏈路得到越來越飽滿的支撐,“集約化生產(chǎn),平臺化應(yīng)用”讓大模型更適配產(chǎn)業(yè)和行業(yè)的現(xiàn)實需要,賦能產(chǎn)業(yè)智能化。

落地成為中國AI的DNA,大模型也不例外。以大模型為代表的AI技術(shù)和先進生產(chǎn)力在各行各業(yè)落地生根,這是為什么智能革命一定會發(fā)生在中國。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-07-07
中國大模型的落地DNA,寫在這個雙螺旋結(jié)構(gòu)里
中國大模型的落地DNA,寫在這個雙螺旋結(jié)構(gòu)里

長按掃碼 閱讀全文