過去數十年信息革命的歷史告訴我們,科技的成功,不在于產業(yè)規(guī)模的龐大,不在于設備數量的多寡,而在于人,在于人的想象力與創(chuàng)造力。
當少年在校園里開發(fā)出驚人的AI應用;當上班族用AI破解了困擾行業(yè)已久的難題;當一個普通人用成為開發(fā)者的方式實現了自己的夢想,這時我們才可以毫無疑問地說,科技成功了,AI成功了。
2023年以來,中國市場迎來了“百模趕考”的盛況。但當我們把視角放在具體的AI開發(fā)者身上,會察覺開發(fā)者能感受到的區(qū)別并不大。大部分AI大模型,都無法真正成為開發(fā)者手中的能力與工具。圍繞大模型的AI開發(fā)者生態(tài)難以聚攏。模型與應用開發(fā)之間存在著較為明顯的割裂。模型層面的技術進化,與開發(fā)者的真實需求之間存在著較為顯著的代溝。
這種情況如何破局?大模型如何才能真正來到開發(fā)者手中?
在4月16日,以“創(chuàng)造未來”為主題的Create 2024百度AI開發(fā)者大會在深圳國際會展中心舉辦。期間,百度首席技術官王海峰以“技術筑基,星河璀璨”為主題發(fā)表演講,解讀了智能體、代碼、多模型等多項文心大模型的關鍵技術和最新進展。王海峰表示,“未來,我們將繼續(xù)投身人才培養(yǎng),讓人才的點點星光,匯成璀璨星河。智能時代,人人都是開發(fā)者,人人都是創(chuàng)造者,讓我們一起,創(chuàng)造美好未來”。
與絕大多數大模型項目,強調參數、精度等指標不同。文心大模型選擇了另外一條路:深入開發(fā)者的需求與夢想,開發(fā)者需要什么,文心就做什么。
沿著這樣的軌跡,文心一路進化,展現出了巨大的技術爆發(fā)力。這既奠定了文心大模型的規(guī)?;仓瘟怂拈L期發(fā)展方向。
文心的未來非常明確:把開發(fā)者的夢想聯接在一起,就能組成AI大模型的璀璨星河。
何處是星河?開發(fā)者的夢想就是星河
在今天我們已經可以明確地說,文心大模型是中國,乃至全球,技術進步最快,體系化升級最頻繁的大模型之一。自去年3月16日發(fā)布知識增強大語言模型文心一言以來,百度不斷推動文心大模型的升級迭代。
并且每一次版本升級都展現出核心技術的進化。文心速度,已經成為AI行業(yè)的獨特風景。
比如說,在文心大模型3.0版本當中,全面加入了知識增強、檢索增強和對話增強技術;文心3.5版本則帶來了基礎模型的全面升級,加入了精調技術創(chuàng)新、知識點增強、邏輯推理增強等能力;文心4.0則實現了萬卡算力的大規(guī)模并行訓練,通過與飛槳平臺聯合調優(yōu),帶來了多維數據、多階段對齊、可再生訓練等技術能力。
在大幅度、高效率的升級過程中,文心大模型能力愈發(fā)強大,效果和性能全面提升。這時很多朋友會好奇,文心究竟如何挖掘這么多的技術升級方向?為什么要保持如此高強度的升級態(tài)勢?
在Create 2024,我們就可以找到答案。
在開發(fā)者的視角看來,AI大模型正在帶來跨世代的開發(fā)奇點。原本的應用開發(fā)邊界一下被打破。AI帶來了數量龐大的新應用種類,帶來了全面降低的開發(fā)門檻,以及前所未見的開發(fā)效率。但想要真正實現AI應用開發(fā)的夢想,還需要新的技術基礎作為錨點。將AI大模型真正變?yōu)殚_發(fā)者手中的能力,在今天還要解決三大難題:
1.如何將AI大模型作為基礎,打破過往開發(fā)邊界,將那些前所未有的開發(fā)創(chuàng)意變?yōu)榭赡埽咳绾螌崿F更加智能化、前沿化的AI開發(fā)?
2.如何進一步降低開發(fā)門檻,實現低代碼,甚至無代碼的開發(fā)范式,從而實現人人都是AI開發(fā)者的時代愿景?
3.如何降低開發(fā)成本,提升開發(fā)效率,進一步完善基于AI大模型的應用開發(fā)機制,讓AI應用開發(fā)更加具備可操作性與可實現性?
打破邊界、降低門檻、優(yōu)化機制,是當前開發(fā)者對AI大模型最迫切的三個愿望。而在文心大模型的最新升級中,也恰好回應了開發(fā)者的需求。
王海峰說,“希望讓人才的點點星光,匯成璀璨星河”。
對于文心大模型來說,只有回應開發(fā)者的需求,了解開發(fā)者的愿望,才能點亮這些星光。
對于文心大模型來說,AI開發(fā)者的夢想,就是以每個腳印所要奔赴的星河。
智能體,開發(fā)邊界的跨越
首先讓我們來看,文心大模型是如何打破開發(fā)邊界,帶給開發(fā)者最前沿的技術可能性。
在今天,全球AI行業(yè)最為熱議的技術方向,就是智能體。具備思考、分析、推理等多元能力為一身的智能體機制,被廣泛看好為AI技術的未來發(fā)展方向,同時也是大模型落地為AI原生應用的重要支點。
在去年10月,百度就在文心大模型中引入了智能體機制,王海峰分享了對于快思考與慢思考的理解。而在剛剛的Create 2024百度AI開發(fā)者大會中,文心大模型的技術架構中正式增加了智能體。王海峰表示,“智能體是重要的發(fā)展方向,會帶來更多的應用爆發(fā)。智能體是在基礎模型上,進一步進行思考增強訓練,包括思考過程的有監(jiān)督精調、行為決策的偏好學習、結果反思的增強學習,進而得到思考模型。智能體的思考模型像人一樣,會閱讀說明書,學習工具的使用方法,進而可以調用工具來完成任務”。
在現場,王海峰演示了文心大模型4.0工具版上,如何調用工具。向文心一言提問,“我要到大灣區(qū)出差一周,想了解一下天氣變化,好決定帶什么衣服。請幫我查一下未來一周北京和深圳的溫度,告訴我出差應該帶什么衣服,并整理成表格”。
面對這一系列復雜的提問,以及相當專業(yè)的信息整理、表格生成需求,文心一言中的智能體機制,可以像人一樣進行思考、規(guī)劃,從而將需求拆解成多個子任務,首先調用“高級聯網”工具來查詢天氣信息,然后調用“代碼解釋器”畫溫度趨勢圖,進而根據未來一周的天氣情況,選擇了合適的衣物,最后對結果進行思考、確認,并自動匯總成一個表格。
這樣的技術能力,已經遠遠打破了以往AI技術,乃至大模型技術的能力邊界。開發(fā)者可以通過新的技術底座,探索更多樣,更廣袤的智能化未來。
打破邊界,是文心4.0帶給開發(fā)者第一份禮物。
智能代碼,開發(fā)范式的革新
我們都知道,傳統的應用開發(fā)范式,是基于不同編程語言的代碼書寫來實現的。而AI大模型帶給開發(fā)范式的最大變革,在于大模型本身能夠輔助生成代碼,甚至完成無代碼情況下的應用生成。
面向AI開發(fā)者與潛在AI開發(fā)者對于低門檻開發(fā)的廣泛需求,百度基于文心大模型的自然語言的能力和代碼能力,開發(fā)了代碼智能體和智能代碼助手。
其中,代碼智能體可以實現無代碼的應用開發(fā),讓人人都可以成為AI開發(fā)者。
代碼智能體,在技術上是基于思考模型與代碼解釋器來實現。首先,思考模型會理解用戶需求,經過思考,把完成任務的指令和相關信息整合成提示,輸入給代碼解釋器。隨后,代碼解釋器根據提示,把自然語言表達的用戶需求翻譯成代碼并執(zhí)行,得到執(zhí)行結果或者調試信息。接著,思考模型對代碼解釋器的執(zhí)行結果進行反思確認,如果正確,就把結果返回給用戶,不正確就繼續(xù)進行自主迭代更新。通過這樣的邏輯機制,智能體可以充分理解用戶的代碼生成需求,并且為結果的正確負責,實現“只要說說話,就能完成AI應用開發(fā)”。
智能代碼助手,則可以幫助專業(yè)程序員更高效地、更便捷寫出高質量代碼。在模型效果不斷提升的基礎上,百度進一步構建了智能代碼助手上下文增強、私域知識增強、流程無縫集成等能力。
目前,智能代碼助手Comate整體采納率已經達到了46%,新增代碼中生成的比例已經達到了27%。而Comate能力則可以把代碼理解、生成、優(yōu)化等能力無縫集成到研發(fā)流程的各個環(huán)節(jié),幫助提升代碼開發(fā)質量和效率。通過簡單的指令,就可以快速了解整個代碼的架構,甚至是每一個模塊的具體實現邏輯,還可以根據當前的項目代碼以及第三方代碼自動生成滿足要求的新代碼,從而讓開發(fā)人員的工作更加輕松,獲得的支持與幫助更加立體。
代碼輔助與無代碼生成,是AI時代開發(fā)范式革新的根基。百度持續(xù)在這兩方面發(fā)力,帶給了AI開發(fā)者第二份重要的禮物——超低門檻的開發(fā)機遇。
多模型,開發(fā)機制的優(yōu)化
除了智能體、代碼能力之外,百度還著重推出了多模型技術。在開發(fā)者實際進行AI應用開發(fā)的過程中,對AI模型的調用和選擇是非常復雜的,往往會出現需要根據不同場景進行多模型搭配,根據軟硬件環(huán)境進行模型切換的問題。然而往往也就在多模型選擇過程中,會出現各種各樣的兼容難點以及不得已的取舍。
為了實現大模型應用在效果、效率與成本間的平衡,百度推出了多模型技術。
首先,是全面支持高效低成本的模型生產。為了實現高效低成本模型生產,百度研制了大小模型協同的訓練機制,可以有效進行知識繼承,高效生產高質量小模型,也可以利用小模型實現對比增強,幫助大模型的訓練。
同時,百度建設了種子模型矩陣,數據提質與增強機制,以及從預訓練、精調對齊、模型壓縮到推理部署的配套工具鏈。高效低成本模型生產機制,可以助力應用開發(fā)的速度更快、成本更低、效果更好。
在多模型推理方面,百度研制了基于反饋學習的端到端多模型推理技術,構建了智能路由模型,進行端到端反饋學習,充分發(fā)揮不同模型處理不同任務的能力,達到效果、效率和成本的平衡。
面向未來,多模型成為AI大模型落地的主要趨勢,而百度又一次領先一步,將其作為帶給開發(fā)者的第三個禮物。
一路前進,終到星河
洞察開發(fā)者的需求,助力開發(fā)的夢想。這個簡單的邏輯構筑了文心大模型前進的坐標,使其可以持續(xù)奔跑,一往無前。
除了智能體、代碼和多模型技術,文心大模型還在諸多方面進行了持續(xù)創(chuàng)新,包括基于模型反饋閉環(huán)的數據體系、基于自反饋增強的大模型對齊技術,以及多模態(tài)技術等??傮w而言,文心大模型4.0的效果持續(xù)提升,發(fā)布后的半年時間,提升了52.5%的整體效果。
而文心大模型的持續(xù)快速進化,得益于百度在芯片、框架、模型和應用上的全棧布局,尤其是飛槳深度學習平臺和文心的聯合優(yōu)化。文心大模型的周均訓練有效率達到98.8%,相比一年前文心一言發(fā)布時,訓練效率提升到當時的5.1倍,推理105倍。
在持續(xù)的技術創(chuàng)新中,文心大模型成為AI開發(fā)者的首選。截至目前,飛槳文心生態(tài)已凝聚1295萬開發(fā)者,服務24.4萬家企事業(yè)單位,基于飛槳和文心創(chuàng)建了89.5萬個模型。文心一言累計用戶規(guī)模已達2億,日均調用量也達到了2億,滿足了千行百業(yè)的智能化需求。
在關鍵的人才培養(yǎng)環(huán)節(jié)中,百度在2020年提出了5年為全社會培養(yǎng)500萬AI人才的目標已經提前完成。文心加飛槳,已經成為AI開發(fā)者開啟夢想之旅的不二選擇。
以開發(fā)者的真實需求為導航,以開發(fā)者的普遍期待為路標,以開發(fā)者的偉大夢想為未來。
文心就是如此一路前進,一路保持了高速迭代與全面進化。
文心會持續(xù)向前,在無數AI開發(fā)者實現夢想的那一天,在中國科技全面喚醒新質生產力的那一天,在AGI曙光到來的那一天,我們星河相見。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 依靠完善產業(yè)鏈,中國制造在又一個行業(yè)超越韓國,技術加速趕超
- 特朗普加稅,Shein避險
- 愛奇藝“開炮”紅果!短劇之戰(zhàn),風波又起!
- 在一次出圈演講,看到AI眼鏡中的“科技哪吒”
- 阿里、京東,暗流涌動
- 他曾舉牌萬科、血洗南玻,如今卻負債489億,被員工堵門暴打
- 世界第一!阿里云PolarDB登頂全球數據庫性能及性價比排行榜
- 榮耀MagicBook Pro 14掀起性能風暴,續(xù)航超12小時
- “耐玩戰(zhàn)神,續(xù)航超神”的真我Neo7 SE,國補到手價僅1530元起
- “小單快返”遭重創(chuàng),快時尚巨頭要求供應商緊急外遷,“曲線救國”來得及嗎?
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。