Create 2024百度AI開發(fā)者大會,李彥宏發(fā)布文心大模型4.0工具版

“未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,用自己的創(chuàng)造力改變世界?!?/strong>

4月16日,Create 2024百度AI開發(fā)者大會在深圳舉辦。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏發(fā)表了題為《人人都是開發(fā)者》的主旨演講。他認(rèn)為,大模型和生成式AI將徹底改變開發(fā)者這個(gè)群體。

AI正在掀起一場創(chuàng)造力革命,未來開發(fā)應(yīng)用就像拍個(gè)短視頻一樣簡單,人人都是開發(fā)者,人人都是創(chuàng)造者?!?/strong>

百度已經(jīng)為開發(fā)者們準(zhǔn)備好了三大“開箱即用”的工具,包括智能體開發(fā)工具AgentBuilder、AI原生應(yīng)用開發(fā)工具AppBuilder、各種尺寸的模型定制工具M(jìn)odelBuilder?!斑@三個(gè)工具,都代表了先進(jìn)生產(chǎn)力?!?/p>

值得一提的是,李彥宏現(xiàn)場分享了百度在開發(fā)AI原生應(yīng)用上的具體思路,并表示:“這是我們百度根據(jù)過去一年的實(shí)踐,踩了無數(shù)的坑,交了高昂的學(xué)費(fèi)換來的?!?/strong>這三個(gè)開發(fā)AI原生應(yīng)用的思路分別是,MoE、小模型和智能體。

會上,李彥宏正式發(fā)布了文心大模型4.0的工具版。他還透露,截至目前文心一言用戶數(shù)已經(jīng)突破2億?!拔男拇竽P鸵殉蔀橹袊铑I(lǐng)先、應(yīng)用最廣泛的AI基礎(chǔ)模型。”

得益于文心大模型的強(qiáng)大,開發(fā)者通過文心4.0降維裁剪出來的更小尺寸模型,要比直接拿開源模型調(diào)出來的模型,同等尺寸下效果明顯更好;同等效果下,成本明顯更低。“大家以前用開源覺得開源便宜,其實(shí)在大模型場景下,開源是最貴的。所以開源模型會越來越落后?!?/strong>

以下為李彥宏的主要觀點(diǎn):

自然語言將成為新的通用編程語言,只要會說話就可以成為一名開發(fā)者

“大模型和生成式AI,將徹底改變開發(fā)者這個(gè)群體。過去,開發(fā)者用代碼改變世界;未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,用自己的創(chuàng)造力改變世界?!?/p>

“上崗一年多,Comate已經(jīng)走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業(yè),生成的代碼采納率達(dá)到了46%,百度每天新增的代碼中,已經(jīng)有27%是由Comate生成的?!?/p>

“今天,你不會寫代碼,也可以做出一個(gè)AI應(yīng)用;不用編程,也可以做出一個(gè)智能體。AI正在掀起一場創(chuàng)造力革命,未來開發(fā)應(yīng)用就像拍個(gè)短視頻一樣簡單,人人都是開發(fā)者,人人都是創(chuàng)造者?!?/p>

AgentBuilder、AppBuilder、ModelBuilder,都代表了先進(jìn)生產(chǎn)力

“作為一家技術(shù)公司,百度的角色定位,就是盡可能地為大家提供所需的開發(fā)工具,不斷提升整個(gè)社會的創(chuàng)造力?!?/p>

“具體來說,我們提供1個(gè)強(qiáng)大的基礎(chǔ)模型系列,就是文心大模型系列,這包括旗艦版的ERNIE3.5, ERNIE4.0, 也包括輕量版的ERNIE Speed、Lite、Tiny等等?!?/p>

“我們還提供基于大模型來開發(fā)各種應(yīng)用的工具,包括智能體開發(fā)工具AgentBuilder,AI原生應(yīng)用開發(fā)工具AppBuilder,以及各種尺寸的模型定制工具M(jìn)odelBuilder。這三個(gè)工具,都代表了先進(jìn)生產(chǎn)力?!?/p>

文心一言用戶數(shù)突破2億,文心大模型4.0工具版正式發(fā)布

“文心一言從去年3月16日發(fā)布,到今天是一年零一個(gè)月的時(shí)間。我們的用戶數(shù)突破了2億,API日均調(diào)用量也突破了2億,服務(wù)客戶數(shù)達(dá)到了8.5萬,利用千帆平臺開發(fā)的AI原生應(yīng)用數(shù)超過了19萬?!?/p>

“近幾個(gè)月來,文心大模型在代碼生成、代碼解釋、代碼優(yōu)化等通用能力方面實(shí)現(xiàn)了進(jìn)一步的顯著提升,達(dá)到國際領(lǐng)先水平。今天,我們正式發(fā)布文心大模型4.0的工具版?!?/p>

“文心大模型已經(jīng)成為了中國最領(lǐng)先、應(yīng)用最廣泛的AI基礎(chǔ)模型?!?/p>

“相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調(diào)用1萬次,同樣成本現(xiàn)在一天可以調(diào)用100萬次?!?/p>

開發(fā)AI原生應(yīng)用的具體思路,是過去一年踩了無數(shù)坑、交了高昂學(xué)費(fèi)換來的

“大模型本身并不直接創(chuàng)造價(jià)值,基于大模型開發(fā)出來的AI應(yīng)用才能滿足真實(shí)的市場需求?!?/p>

“今天我想跟大家分享的是一些基于大模型開發(fā)AI原生應(yīng)用的具體思路和工具。這是我們百度根據(jù)過去一年的實(shí)踐,踩了無數(shù)的坑,交了高昂的學(xué)費(fèi)換來的?!?/p>

“第一是MoE。未來大型的AI原生應(yīng)用基本都是MoE架構(gòu),這里所說的MoE不是一般的學(xué)術(shù)概念,而是大小模型的混用,不依賴一個(gè)模型來解決所有問題?!?/p>

“第二是小模型。小模型推理成本低,響應(yīng)速度快,在一些特定場景中,經(jīng)過SFT精調(diào)后的小模型,它的使用效果可以媲美大模型。這就是我們發(fā)布Speed,Lite、Tiny三個(gè)輕量模型的原因。我們通過大模型,壓縮蒸餾出來一個(gè)基礎(chǔ)模型,然后再用數(shù)據(jù)去訓(xùn)練,這比從頭開始訓(xùn)小模型,效果要好很多,比基于開源模型訓(xùn)出來的模型,效果更好,速度更快,成本更低?!?/p>

“第三是智能體。智能體是當(dāng)下很熱的一個(gè)話題,隨著智能體能力的提升,會不斷催生出大量新的應(yīng)用。智能體機(jī)制,包括理解、規(guī)劃、反思和進(jìn)化,它讓機(jī)器像人一樣思考和行動,可以自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)、實(shí)現(xiàn)自我迭代和進(jìn)化。在一些復(fù)雜系統(tǒng)中,我們還可以讓不同的智能體互動,相互協(xié)作,更高質(zhì)量地完成任務(wù)?!?/p>

智能體是未來離每個(gè)人最近、最主流的大模型使用方式

“智能體可能是未來離每個(gè)人最近、最主流的大模型使用方式,基于強(qiáng)大的基礎(chǔ)模型,智能體可以批量生成,應(yīng)用在各種各樣的場景?!?/p>

“百度剛剛升級了文心智能體平臺。截至目前,已經(jīng)有3萬多個(gè)智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。我們的目標(biāo)是,讓每個(gè)人、每個(gè)組織都成為智能體的開發(fā)者,打造國內(nèi)最完整的智能體生態(tài)。那如何實(shí)現(xiàn)這個(gè)目標(biāo)呢?就是給大家提供零門檻的智能體開發(fā)工具AgentBuilder?!?/p>

“今天,每一個(gè)商家、每一個(gè)客戶,都能在百度擁有專屬的智能體。整個(gè)過程完全不需要編程,通過類似提示詞的信息輸入,和簡單的幾步操作調(diào)優(yōu),就能迅速生成一個(gè)智能體,成為7X24小時(shí)在線的金牌業(yè)務(wù)員?!?/p>

現(xiàn)場,李彥宏演示了新加坡旅游局、啟德教育和索菲亞三個(gè)智能體案例,手把手教開發(fā)者用自然語言,5分鐘、零門檻創(chuàng)建一個(gè)智能體。

“啟德教育智能體非常的受歡迎,上線第一周,就成功分發(fā)了155萬次,與用戶交互了5.8萬次,線索轉(zhuǎn)化量直線增長、有效線索的轉(zhuǎn)化成本明顯降低,經(jīng)營效率大幅提升?!?/p>

“索菲亞商家智能體上線以來,有效線索成本下降了30%。也就是說,它獲得一個(gè)有效客戶,如果過去的成本是100塊,現(xiàn)在只需要70塊了。

AppBuilder:最好用的AI原生應(yīng)用開發(fā)工具,用自然語言三步就能開發(fā)一個(gè)應(yīng)用

“AppBuilder,它是目前最好用的AI原生應(yīng)用開發(fā)工具。在AppBuilder上面,我們提前封裝和預(yù)置了開發(fā)AI原生應(yīng)用所需的各種組件和框架,大幅降低開發(fā)門檻?!?/p>

“最快只需三步,開發(fā)者就可以用自然語言開發(fā)出一個(gè)AI原生應(yīng)用,并且能夠便捷地發(fā)布、集成到各種各樣的業(yè)務(wù)環(huán)境中?!?/p>

現(xiàn)場,通過“游樂場排隊(duì)助手”、華北電力大學(xué)“華電AI助理”和百度文庫智能漫畫生成三個(gè)案例,李彥宏展示了一個(gè)AI原生應(yīng)用的創(chuàng)建過程。只需名稱設(shè)定、填寫角色指令、插入組件簡單三步,即可創(chuàng)建一個(gè)AI原生應(yīng)用。

他還指出,AppBuilder擁有兩大優(yōu)勢:

“一是功能強(qiáng)大。依托文心4.0對指令的理解和遵循能力,我們的AppBuilder,能保證冷啟動就能達(dá)到一個(gè)不錯(cuò)的水平,不會因?yàn)樾Ч睿倩ê荛L時(shí)間去調(diào)優(yōu),大大降低了開發(fā)門檻。依托檢索增強(qiáng)技術(shù)RAG,在知識問答等典型場景,我們的問答準(zhǔn)確率和友好回復(fù)程度都達(dá)到了95%以上,大幅超越其他同類產(chǎn)品。”

“AppBuilder還提供豐富完整的組件工具,包括百度搜索等基于百度多年技術(shù)積累的AI能力組件、大模型能力組件,還有百度獨(dú)家開放的業(yè)務(wù)組件等55個(gè)組件。以及一些主流場景的第三方API,比如航班查詢、論文查詢等。我們還剛剛支持了自定義組件,客戶可以直接對接自己專有的任何工具和數(shù)據(jù)。這些豐富的組件,共同支撐起了AI原生應(yīng)用的高效開發(fā)?!?/p>

“二是簡單易用。使用AppBuilder,只需三步即可快速創(chuàng)建應(yīng)用、一鍵分發(fā)。我們也支持開源的SDK,方便大家進(jìn)行二次開發(fā)?!?/p>

各種尺寸的模型定制工具M(jìn)odelBuilder:高效低價(jià)生產(chǎn)模型

“更適合專業(yè)開發(fā)者使用的工具,那就是ModelBuilder,它可以根據(jù)開發(fā)者的需求定制任意尺寸的模型,并根據(jù)細(xì)分場景對模型進(jìn)一步精調(diào)SFT,這樣就能達(dá)到更好的效果?!?/p>

現(xiàn)場,李彥宏展示了教育行業(yè)作文批改的案例,經(jīng)過數(shù)據(jù)處理、模型精調(diào)后的“作文批改助手”,不僅可以擁有更專業(yè)的老師點(diǎn)評思維、做到格式遵循,而且相比未精調(diào)模型,精調(diào)后的模型打分與真實(shí)的老師點(diǎn)評分?jǐn)?shù)更為接近。

他還在現(xiàn)場與小度實(shí)時(shí)互動,展示小度用MoE多個(gè)模型組合的方式來執(zhí)行不同任務(wù),例如使用小模型ERNIE Tiny執(zhí)行模型路由工作,而性能最好的文心4.0則用來執(zhí)行日程安排等復(fù)雜需求。據(jù)介紹,相比全部使用文心大模型的旗艦版,小度可以實(shí)現(xiàn)響應(yīng)速度提升2倍,成本下降99%。

李彥宏表示,“這幾個(gè)關(guān)于ModelBuilder的例子,展示的是百度高效低價(jià)生產(chǎn)模型的能力”。

“為了方便大家快速上手,ModelBuilder預(yù)置了最全面最豐富的大模型。包括了ERNIE3.5和ERNIE4.0,這是旗艦版的大模型,它適合通用的復(fù)雜場景,能力強(qiáng)大;還有三個(gè)輕量級的大模型,ERNIE Speed、Lite、Tiny;另外還有兩個(gè)垂直場景的模型,ERNIE Character適合角色扮演;ERNIE Functions適合對話或問答場景中的外部工具使用和業(yè)務(wù)函數(shù)調(diào)用。當(dāng)然ModelBuilder也支持國內(nèi)外第三方主流模型,總數(shù)量達(dá)到77個(gè),是國內(nèi)擁有大模型數(shù)量最多的開發(fā)平臺?!?/p>

開源模型會越來越落后

“因?yàn)橛辛俗顝?qiáng)大的基礎(chǔ)模型文心4.0,我們可以根據(jù)需要,兼顧效果、響應(yīng)速度,推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,并且支持精調(diào)和post pretrain?!?/p>

“這樣通過降維裁剪出來的模型,比直接拿開源模型調(diào)出來的模型,同等尺寸下效果明顯更好,同等效果下,成本明顯更低。”

“大家以前用開源覺得開源便宜,其實(shí)在大模型場景下,開源是最貴的。所以開源模型會越來越落后?!?/p>

多模態(tài)大模型是通往AGI的必經(jīng)之路,視覺大模型最大的應(yīng)用場景是自動駕駛

“面向未來,我認(rèn)為多模態(tài)大模型,或者說文字、圖片、語音、視頻等多模態(tài)的融合,是基礎(chǔ)模型非常重要的長期發(fā)展方向,是通往AGI的必經(jīng)之路。百度在這些領(lǐng)域有著長期投入,并將及時(shí)更新大模型的最新進(jìn)展?!?/p>

“我有一個(gè)非常不一樣的判斷:視覺大模型最大的應(yīng)用場景是自動駕駛。百度在這個(gè)方向上是最好的,是自動駕駛的全球領(lǐng)導(dǎo)者,我們不只訓(xùn)練AI如何生成視頻,更訓(xùn)練AI理解真實(shí)世界發(fā)生的事情并預(yù)測未來。”

“基于超過1億公里的、中國復(fù)雜城市道路測試?yán)锍虜?shù)據(jù),百度訓(xùn)練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎(chǔ)能力。這讓百度擁有了更智能、適應(yīng)性更強(qiáng)、更安全的自動駕駛方案?!?/p>

人人都可以成為開發(fā)者,未來,必將是一個(gè)由開發(fā)者一起創(chuàng)造出來的未來

“今天的中國,有10億互聯(lián)網(wǎng)用戶,有強(qiáng)大的基礎(chǔ)大模型,有足夠多的AI應(yīng)用場景,有全球最完備的產(chǎn)業(yè)體系,國家也在大力鼓勵(lì)和支持‘人工智能+’行動,每一個(gè)人,每一家企業(yè),只需要充分利用這些工具,就可以釋放無限的創(chuàng)造力和生產(chǎn)力?!?/p>

“人人都可以成為開發(fā)者,而未來,也必將是一個(gè)由開發(fā)者一起創(chuàng)造出來的未來!”

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

  • 簡版
  • 原版
  • 投稿
  • 回頂部
2024-04-16
Create 2024百度AI開發(fā)者大會,李彥宏發(fā)布文心大模型4.0工具版
Create2024百度AI開發(fā)者大會,李彥宏發(fā)布文心大模型4.0工具版

長按掃碼 閱讀全文