過去數(shù)十年信息革命的歷史告訴我們,科技的成功,不在于產(chǎn)業(yè)規(guī)模的龐大,不在于設(shè)備數(shù)量的多寡,而在于人,在于人的想象力與創(chuàng)造力。
當少年在校園里開發(fā)出驚人的AI應(yīng)用;當上班族用AI破解了困擾行業(yè)已久的難題;當一個普通人用成為開發(fā)者的方式實現(xiàn)了自己的夢想,這時我們才可以毫無疑問地說,科技成功了,AI成功了。
2023年以來,中國市場迎來了“百模趕考”的盛況。但當我們把視角放在具體的AI開發(fā)者身上,會察覺開發(fā)者能感受到的區(qū)別并不大。大部分AI大模型,都無法真正成為開發(fā)者手中的能力與工具。圍繞大模型的AI開發(fā)者生態(tài)難以聚攏。模型與應(yīng)用開發(fā)之間存在著較為明顯的割裂。模型層面的技術(shù)進化,與開發(fā)者的真實需求之間存在著較為顯著的代溝。
這種情況如何破局?大模型如何才能真正來到開發(fā)者手中?
在4月16日,以“創(chuàng)造未來”為主題的Create 2024百度AI開發(fā)者大會在深圳國際會展中心舉辦。期間,百度首席技術(shù)官王海峰以“技術(shù)筑基,星河璀璨”為主題發(fā)表演講,解讀了智能體、代碼、多模型等多項文心大模型的關(guān)鍵技術(shù)和最新進展。王海峰表示,“未來,我們將繼續(xù)投身人才培養(yǎng),讓人才的點點星光,匯成璀璨星河。智能時代,人人都是開發(fā)者,人人都是創(chuàng)造者,讓我們一起,創(chuàng)造美好未來”。
與絕大多數(shù)大模型項目,強調(diào)參數(shù)、精度等指標不同。文心大模型選擇了另外一條路:深入開發(fā)者的需求與夢想,開發(fā)者需要什么,文心就做什么。
沿著這樣的軌跡,文心一路進化,展現(xiàn)出了巨大的技術(shù)爆發(fā)力。這既奠定了文心大模型的規(guī)?;?yīng),也筑牢了它的長期發(fā)展方向。
文心的未來非常明確:把開發(fā)者的夢想聯(lián)接在一起,就能組成AI大模型的璀璨星河。
何處是星河?開發(fā)者的夢想就是星河
在今天我們已經(jīng)可以明確地說,文心大模型是中國,乃至全球,技術(shù)進步最快,體系化升級最頻繁的大模型之一。自去年3月16日發(fā)布知識增強大語言模型文心一言以來,百度不斷推動文心大模型的升級迭代。
并且每一次版本升級都展現(xiàn)出核心技術(shù)的進化。文心速度,已經(jīng)成為AI行業(yè)的獨特風景。
比如說,在文心大模型3.0版本當中,全面加入了知識增強、檢索增強和對話增強技術(shù);文心3.5版本則帶來了基礎(chǔ)模型的全面升級,加入了精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強等能力;文心4.0則實現(xiàn)了萬卡算力的大規(guī)模并行訓練,通過與飛槳平臺聯(lián)合調(diào)優(yōu),帶來了多維數(shù)據(jù)、多階段對齊、可再生訓練等技術(shù)能力。
在大幅度、高效率的升級過程中,文心大模型能力愈發(fā)強大,效果和性能全面提升。這時很多朋友會好奇,文心究竟如何挖掘這么多的技術(shù)升級方向?為什么要保持如此高強度的升級態(tài)勢?
在Create 2024,我們就可以找到答案。
在開發(fā)者的視角看來,AI大模型正在帶來跨世代的開發(fā)奇點。原本的應(yīng)用開發(fā)邊界一下被打破。AI帶來了數(shù)量龐大的新應(yīng)用種類,帶來了全面降低的開發(fā)門檻,以及前所未見的開發(fā)效率。但想要真正實現(xiàn)AI應(yīng)用開發(fā)的夢想,還需要新的技術(shù)基礎(chǔ)作為錨點。將AI大模型真正變?yōu)殚_發(fā)者手中的能力,在今天還要解決三大難題:
1.如何將AI大模型作為基礎(chǔ),打破過往開發(fā)邊界,將那些前所未有的開發(fā)創(chuàng)意變?yōu)榭赡??如何實現(xiàn)更加智能化、前沿化的AI開發(fā)?
2.如何進一步降低開發(fā)門檻,實現(xiàn)低代碼,甚至無代碼的開發(fā)范式,從而實現(xiàn)人人都是AI開發(fā)者的時代愿景?
3.如何降低開發(fā)成本,提升開發(fā)效率,進一步完善基于AI大模型的應(yīng)用開發(fā)機制,讓AI應(yīng)用開發(fā)更加具備可操作性與可實現(xiàn)性?
打破邊界、降低門檻、優(yōu)化機制,是當前開發(fā)者對AI大模型最迫切的三個愿望。而在文心大模型的最新升級中,也恰好回應(yīng)了開發(fā)者的需求。
王海峰說,“希望讓人才的點點星光,匯成璀璨星河”。
對于文心大模型來說,只有回應(yīng)開發(fā)者的需求,了解開發(fā)者的愿望,才能點亮這些星光。
對于文心大模型來說,AI開發(fā)者的夢想,就是以每個腳印所要奔赴的星河。
智能體,開發(fā)邊界的跨越
首先讓我們來看,文心大模型是如何打破開發(fā)邊界,帶給開發(fā)者最前沿的技術(shù)可能性。
在今天,全球AI行業(yè)最為熱議的技術(shù)方向,就是智能體。具備思考、分析、推理等多元能力為一身的智能體機制,被廣泛看好為AI技術(shù)的未來發(fā)展方向,同時也是大模型落地為AI原生應(yīng)用的重要支點。
在去年10月,百度就在文心大模型中引入了智能體機制,王海峰分享了對于快思考與慢思考的理解。而在剛剛的Create 2024百度AI開發(fā)者大會中,文心大模型的技術(shù)架構(gòu)中正式增加了智能體。王海峰表示,“智能體是重要的發(fā)展方向,會帶來更多的應(yīng)用爆發(fā)。智能體是在基礎(chǔ)模型上,進一步進行思考增強訓練,包括思考過程的有監(jiān)督精調(diào)、行為決策的偏好學習、結(jié)果反思的增強學習,進而得到思考模型。智能體的思考模型像人一樣,會閱讀說明書,學習工具的使用方法,進而可以調(diào)用工具來完成任務(wù)”。
在現(xiàn)場,王海峰演示了文心大模型4.0工具版上,如何調(diào)用工具。向文心一言提問,“我要到大灣區(qū)出差一周,想了解一下天氣變化,好決定帶什么衣服。請幫我查一下未來一周北京和深圳的溫度,告訴我出差應(yīng)該帶什么衣服,并整理成表格”。
面對這一系列復雜的提問,以及相當專業(yè)的信息整理、表格生成需求,文心一言中的智能體機制,可以像人一樣進行思考、規(guī)劃,從而將需求拆解成多個子任務(wù),首先調(diào)用“高級聯(lián)網(wǎng)”工具來查詢天氣信息,然后調(diào)用“代碼解釋器”畫溫度趨勢圖,進而根據(jù)未來一周的天氣情況,選擇了合適的衣物,最后對結(jié)果進行思考、確認,并自動匯總成一個表格。
這樣的技術(shù)能力,已經(jīng)遠遠打破了以往AI技術(shù),乃至大模型技術(shù)的能力邊界。開發(fā)者可以通過新的技術(shù)底座,探索更多樣,更廣袤的智能化未來。
打破邊界,是文心4.0帶給開發(fā)者第一份禮物。
智能代碼,開發(fā)范式的革新
我們都知道,傳統(tǒng)的應(yīng)用開發(fā)范式,是基于不同編程語言的代碼書寫來實現(xiàn)的。而AI大模型帶給開發(fā)范式的最大變革,在于大模型本身能夠輔助生成代碼,甚至完成無代碼情況下的應(yīng)用生成。
面向AI開發(fā)者與潛在AI開發(fā)者對于低門檻開發(fā)的廣泛需求,百度基于文心大模型的自然語言的能力和代碼能力,開發(fā)了代碼智能體和智能代碼助手。
其中,代碼智能體可以實現(xiàn)無代碼的應(yīng)用開發(fā),讓人人都可以成為AI開發(fā)者。
代碼智能體,在技術(shù)上是基于思考模型與代碼解釋器來實現(xiàn)。首先,思考模型會理解用戶需求,經(jīng)過思考,把完成任務(wù)的指令和相關(guān)信息整合成提示,輸入給代碼解釋器。隨后,代碼解釋器根據(jù)提示,把自然語言表達的用戶需求翻譯成代碼并執(zhí)行,得到執(zhí)行結(jié)果或者調(diào)試信息。接著,思考模型對代碼解釋器的執(zhí)行結(jié)果進行反思確認,如果正確,就把結(jié)果返回給用戶,不正確就繼續(xù)進行自主迭代更新。通過這樣的邏輯機制,智能體可以充分理解用戶的代碼生成需求,并且為結(jié)果的正確負責,實現(xiàn)“只要說說話,就能完成AI應(yīng)用開發(fā)”。
智能代碼助手,則可以幫助專業(yè)程序員更高效地、更便捷寫出高質(zhì)量代碼。在模型效果不斷提升的基礎(chǔ)上,百度進一步構(gòu)建了智能代碼助手上下文增強、私域知識增強、流程無縫集成等能力。
目前,智能代碼助手Comate整體采納率已經(jīng)達到了46%,新增代碼中生成的比例已經(jīng)達到了27%。而Comate能力則可以把代碼理解、生成、優(yōu)化等能力無縫集成到研發(fā)流程的各個環(huán)節(jié),幫助提升代碼開發(fā)質(zhì)量和效率。通過簡單的指令,就可以快速了解整個代碼的架構(gòu),甚至是每一個模塊的具體實現(xiàn)邏輯,還可以根據(jù)當前的項目代碼以及第三方代碼自動生成滿足要求的新代碼,從而讓開發(fā)人員的工作更加輕松,獲得的支持與幫助更加立體。
代碼輔助與無代碼生成,是AI時代開發(fā)范式革新的根基。百度持續(xù)在這兩方面發(fā)力,帶給了AI開發(fā)者第二份重要的禮物——超低門檻的開發(fā)機遇。
多模型,開發(fā)機制的優(yōu)化
除了智能體、代碼能力之外,百度還著重推出了多模型技術(shù)。在開發(fā)者實際進行AI應(yīng)用開發(fā)的過程中,對AI模型的調(diào)用和選擇是非常復雜的,往往會出現(xiàn)需要根據(jù)不同場景進行多模型搭配,根據(jù)軟硬件環(huán)境進行模型切換的問題。然而往往也就在多模型選擇過程中,會出現(xiàn)各種各樣的兼容難點以及不得已的取舍。
為了實現(xiàn)大模型應(yīng)用在效果、效率與成本間的平衡,百度推出了多模型技術(shù)。
首先,是全面支持高效低成本的模型生產(chǎn)。為了實現(xiàn)高效低成本模型生產(chǎn),百度研制了大小模型協(xié)同的訓練機制,可以有效進行知識繼承,高效生產(chǎn)高質(zhì)量小模型,也可以利用小模型實現(xiàn)對比增強,幫助大模型的訓練。
同時,百度建設(shè)了種子模型矩陣,數(shù)據(jù)提質(zhì)與增強機制,以及從預訓練、精調(diào)對齊、模型壓縮到推理部署的配套工具鏈。高效低成本模型生產(chǎn)機制,可以助力應(yīng)用開發(fā)的速度更快、成本更低、效果更好。
在多模型推理方面,百度研制了基于反饋學習的端到端多模型推理技術(shù),構(gòu)建了智能路由模型,進行端到端反饋學習,充分發(fā)揮不同模型處理不同任務(wù)的能力,達到效果、效率和成本的平衡。
面向未來,多模型成為AI大模型落地的主要趨勢,而百度又一次領(lǐng)先一步,將其作為帶給開發(fā)者的第三個禮物。
一路前進,終到星河
洞察開發(fā)者的需求,助力開發(fā)的夢想。這個簡單的邏輯構(gòu)筑了文心大模型前進的坐標,使其可以持續(xù)奔跑,一往無前。
除了智能體、代碼和多模型技術(shù),文心大模型還在諸多方面進行了持續(xù)創(chuàng)新,包括基于模型反饋閉環(huán)的數(shù)據(jù)體系、基于自反饋增強的大模型對齊技術(shù),以及多模態(tài)技術(shù)等??傮w而言,文心大模型4.0的效果持續(xù)提升,發(fā)布后的半年時間,提升了52.5%的整體效果。
而文心大模型的持續(xù)快速進化,得益于百度在芯片、框架、模型和應(yīng)用上的全棧布局,尤其是飛槳深度學習平臺和文心的聯(lián)合優(yōu)化。文心大模型的周均訓練有效率達到98.8%,相比一年前文心一言發(fā)布時,訓練效率提升到當時的5.1倍,推理105倍。
在持續(xù)的技術(shù)創(chuàng)新中,文心大模型成為AI開發(fā)者的首選。截至目前,飛槳文心生態(tài)已凝聚1295萬開發(fā)者,服務(wù)24.4萬家企事業(yè)單位,基于飛槳和文心創(chuàng)建了89.5萬個模型。文心一言累計用戶規(guī)模已達2億,日均調(diào)用量也達到了2億,滿足了千行百業(yè)的智能化需求。
在關(guān)鍵的人才培養(yǎng)環(huán)節(jié)中,百度在2020年提出了5年為全社會培養(yǎng)500萬AI人才的目標已經(jīng)提前完成。文心加飛槳,已經(jīng)成為AI開發(fā)者開啟夢想之旅的不二選擇。
以開發(fā)者的真實需求為導航,以開發(fā)者的普遍期待為路標,以開發(fā)者的偉大夢想為未來。
文心就是如此一路前進,一路保持了高速迭代與全面進化。
文心會持續(xù)向前,在無數(shù)AI開發(fā)者實現(xiàn)夢想的那一天,在中國科技全面喚醒新質(zhì)生產(chǎn)力的那一天,在AGI曙光到來的那一天,我們星河相見。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 乘云而上,OceanBase再越山峰
- 新浪新聞探索大會在京舉行 探索新質(zhì)生產(chǎn)力賦能產(chǎn)業(yè)新路徑
- 銷量差異背后:小米如何在全球競爭中逆襲,國內(nèi)卻遭遇瓶頸?
- OPPO式出海,為全球化講一個“落地生根”的故事
- MLPerf Storage揭榜,「存儲」掛帥,驅(qū)動AI上演“飛馳人生”
- 技術(shù)創(chuàng)新締造產(chǎn)業(yè)應(yīng)用價值,京東何曉冬論文獲CIKM最佳時間檢驗獎
- 高通揭開遮羞布,ARM已失去創(chuàng)新力,壟斷地位被動搖
- 中國制造太厲害,售價降九成,三星被迫再關(guān)閉一項業(yè)務(wù)
- 麥當勞、肯德基、星巴克拍短劇,短劇會成為品牌常規(guī)營銷手段嗎?
- 今年雙11大變樣,淘寶京東不卷了!
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。