1725年,法國的紡織工人Basile Bouchon發(fā)明了一種織布機,可以根據送入的穿孔卡片指令編織圖案。打孔的是“1”,沒有打孔是“0”。這幾乎是最早出現(xiàn)的二進制代碼,雖然此后執(zhí)行的機器發(fā)生了很大變化,但代碼的基本構建塊卻就此延續(xù)了下來。
三百年后,編程已成為改變世界的無形力量。今天我們手中的智能手機、辦公室的自動化系統(tǒng)甚至工廠的智能制造,它無處不在。
但AI浪潮的席卷速度,不僅超過了以往任何一場技術革命,也讓編程有了另外一種可能——按照李彥宏的說法,大模型和生成式AI將徹底改變開發(fā)者這個群體。
而在這背后,是百模大戰(zhàn)后徐徐鋪開的AI原生應用建設,以及在這關鍵的賽道上,中國企業(yè)已經率先站上了起跑線。
AI原生應用開發(fā),沒那么復雜
到目前為止,全世界已經發(fā)展出超過600門的編程語言。從語法簡單只有32個keywords的C語言,到以但丁《地獄》中第八層地獄命名的Malbolge(第一個程序花了兩年時間才被寫出來)。
但無論是哪種編程語言,開發(fā)者想要創(chuàng)建程序就要敲下海量的代碼。隨著代碼量越來越大,程序開發(fā)工作也變得無比繁雜。
例如Windows 95只有1500萬行,Windows XP為3500萬行,而目前程序員寫出來的最大軟件是Google在線服務,大概是20億行代碼,大概是一名程序員正常發(fā)量的13000倍。
而當前正值移動互聯(lián)網轉向AI時代,按照李彥宏的觀點,AI時代需要100萬量級的原生應用,趨近2021年手機App總量的三分之一。
如果參考支付寶僅2019年一年就增加了4億行代碼(相當于80個魔獸世界)的話,AI原生應用需要程序員敲下的代碼量可想而知。
而且AI原生應用在邏輯上完全不同于Native App,需要以AI為出發(fā)點,將AI作為核心驅動力,重新設計和構建應用。
不久前,一位開發(fā)者在論壇上發(fā)布了一則AI原生應用速通指南,雖然開發(fā)流程只有5條,但對于開發(fā)者來說工作量并不低,僅數據準備一項就要耗費大量的人力物力,更別提需要用到的關鍵技術。
但隨著Transformer推開大模型時代的大門,不僅AI應用的轉機來了,程序員開發(fā)者的轉機也出現(xiàn)了。
在AI時代,科技巨頭們不僅在意如何讓技術更容易地被用戶接受,同時也在思考如何簡化程序員的工作。
去年OpenAI推出的GPTs和今年Hugging Face發(fā)布的HuggingChat助手,它們通過將能力封裝,把開發(fā)門檻拉低,進而創(chuàng)造了一個新的職業(yè)——不會編程的開發(fā)者、任何一個普通用戶都能創(chuàng)建自己的AI應用。
如今,給普通人搭梯子的名單上又多了一家科技巨頭,并且是使用中文作為自然語言prompt。
“人人都是開發(fā)者”
「打開開發(fā)界面,第一步給應用起名,第二步填寫角色指令,第三步再插入需要的工具組件?!?/p>
這是出現(xiàn)在今年Create2024百度AI開發(fā)者大會上的一幕。在零代碼的情況下,一個AI原生應用就生成了。
開發(fā)者借助百度發(fā)布的AI原生應用開發(fā)工具AppBuilder,不寫一行代碼,最快只需三步,就可以用自然語言開發(fā)出一個應用,并且還能便捷地發(fā)布、集成到各種各樣的業(yè)務環(huán)境中。
在AppBuilder上面,百度也提供了一定的跨模態(tài)能力,開發(fā)者只需要給一段文字,或者幾句話,就可以快速創(chuàng)建繪畫類應用。百度文庫最新推出的漫畫生成和繪本生成功能,就利用了AppBuilder上提供的這類組件。
關鍵,類似這樣的開發(fā)工具,百度一口氣發(fā)布了三款,除了AppBuilder,還有智能體開發(fā)工具AgentBuilder和面向專業(yè)開發(fā)者的ModelBuilder,主打一個「開箱即用」。
其中,AgentBuilder也是零代碼開發(fā),整個過程完全不需要編程,通過類似prompt(提示詞)的信息輸入,和簡單的幾步操作調優(yōu),就能迅速生成一個智能體。目前百度已經與攜程合作,提供酒店、景點、票務等旅游服務工具。
而為專業(yè)開發(fā)者準備的ModelBuilder,可以根據開發(fā)者的需求定制任意尺寸的模型,并根據細分場景對模型進一步精調,達到更好的效果。
ModelBuilder中既包括適合通用復雜場景的旗艦版ERNIE3.5和ERNIE4.0,也有Speed、Lite、Tiny三個輕量級大模型和ERNIE Character、ERNIE Functions兩個垂直場景模型,也覆蓋了國內外其它第三方主流模型,預置量多達77個大模型,是國內擁有大模型數量最多的開發(fā)平臺。
前兩款工具可實現(xiàn)“人人都是開發(fā)者”,相當于是AI原生應用的沖量擔當,而后一款工具則是保質擔當。
李彥宏判斷,未來絕大多數的AI原生應用都是MoE的,也就是大小模型混用,不依賴一個模型來解決所有問題。
而ModelBuilder也是參考MoE思路,開發(fā)者在一個平臺上可調用多個大模型,意味著開發(fā)成本和產品性能都能達到相對最優(yōu)。
大會上展示的小度添添AI機器人日程規(guī)劃功能,就是調用了不同的模型。
先是由小模型ERNIE Tiny執(zhí)行“模型路由”工作,把晨跑中的天氣問題分配給基于ERNIE Lite打造的精調模型,快速查出氣溫25度、天氣晴朗這些信息;同時,又把更復雜的日程安排,分配給性能最好的文心4.0大模型,來計算一天各項事項安排。
總的來說,MoE架構既能提升開發(fā)平臺的“寬度”,也能兼顧“深度”,大大降低開發(fā)時的算力消耗,降低應用門檻。
對多模態(tài)大模型而言,百度推出的三大AI開發(fā)神器,將會加速killer App的出現(xiàn)時間,而對于視覺大模型來說,其最大應用場景——自動駕駛,早已被市場驗真了。
百度在視覺大模型的發(fā)展有目共睹,不只是訓練AI如何生成視頻,更是訓練AI理解和生成一個真實的場景或世界。
基于超過1億公里的中國復雜城市道路測試里程數據,百度訓練出來的Apollo視覺感知大模型,具備檢測、跟蹤、理解、建圖四大基礎能力。百度也將這些能力下放到了具體產品,比如已在武漢實現(xiàn)7X24小時全天候運營的蘿卜快跑,以及將視覺感知大模型應用到了制圖領域的百度地圖。
梯子要穩(wěn)固
去年,著名計算機科學家吳恩達曾在斯坦福做過一場題演講。他認為AI其實和電力、互聯(lián)網一樣,是一項通用技術,更多的機會在于大規(guī)模應用落地。
這與李彥宏此前的觀點不謀而合。在基礎模型之上,要有千千萬萬甚至數以百萬計的AI原生應用,大模型的價值才能被體現(xiàn)出來。
而今天百度發(fā)布的三大AI開發(fā)神器,相當于搭了一把梯子,讓開發(fā)者和企業(yè)能夠不費力的進入AGI時代。但這里面一個重要的前提是,這把梯子要足夠的穩(wěn)固。
而所謂穩(wěn)固,指的就是基礎大模型的技術水平要過硬。
從數據上看,相比一年前文心大模型的算法訓練效率提升了5.1倍,周均訓練有效率超過了98%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調用1萬次,同樣成本現(xiàn)在可以調用100萬次。
發(fā)布一年零一個月以來,文心一言用戶數突破2億,API日均調用量也突破了2億,服務的客戶數達到了8.5萬,利用千帆平臺開發(fā)的AI原生應用數超過了19萬。
對于企業(yè)和開發(fā)者來說,基于文心大模型開發(fā)原生應用、做二次開發(fā),都能夠擁有更低的推理成本和更高的訓練效率。
這主要基于李彥宏此前對大模型一個精準判斷,與模型開源會越來越落后不同,閉源有真正商業(yè)模式,能夠賺到錢,且在成本上有優(yōu)勢,只要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定是更快的。
事實上,有了強大的基礎大模型,百度能提供很多低門檻,甚至零門檻的開發(fā)工具,大大提高開發(fā)者的生產力。比如三大AI開發(fā)工具之外,基于文心大模型的智能代碼助手Comate。
不僅支持100多種語言和所有主流IDE平臺,可以推薦代碼、生成代碼注釋、進行代碼續(xù)寫、查找代碼缺陷、給出優(yōu)化方案,還可以深度解讀代碼庫、關聯(lián)私域知識生成新的代碼。
上崗一年多以來,Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業(yè),生成的代碼采納率達到了46%,百度每天新增的代碼中,已經有27%是由Comate生成的。
顯然,想要壯大AI原生應用生態(tài),僅靠某一家公司遠遠不夠,需要發(fā)動更多人一起參與創(chuàng)新。
去年5月,百度啟動了“文心杯”創(chuàng)業(yè)大賽,幫助創(chuàng)業(yè)者、開發(fā)者開發(fā)各種AI原生應用。在第一屆大賽中,百度為15支優(yōu)勝團隊提供了數千萬元的資金支持,并在技術、團隊和資源上持續(xù)提供全方位扶持。今年將擴大項目篩選范圍、設置分賽場,加大對創(chuàng)業(yè)者的支持力度,特別優(yōu)秀的項目將有機會獲得最高5000萬人民幣的現(xiàn)金和資源支持。
尾聲
2023年6月,Open AI安全系統(tǒng)負責人&前應用研究負責人Lilian Weng在博客中發(fā)表了一篇文章《大模型驅動的自主代理(LLM Powered Autonomous Agents)》。
Lilian Weng將AI發(fā)展路徑類比自動駕駛L1-L5,而人類當前所處的位置正好從Copilot向Agent過渡。
這對人類社會而言,意味著一次巨大的變革正在孕育,它將惠及產業(yè)和生活的方方面面。而在這個過渡階段里,如何讓更多“高樓大廈”在大模型的地基上拔地而起,正是中國在生成式AI的賽道上,實現(xiàn)反超的最大機會。
與此同時也是百度的巨大機會。文心一言、百度文庫、百度新搜索等,AI原生應用釋放出的新變現(xiàn)機會,將開啟長期增長空間。
中國有10億互聯(lián)網用戶,有強大的基礎大模型,有足夠多的AI應用場景,有全球最完備的產業(yè)體系,國家也在大力鼓勵和支持“人工智能+”行動,每一個人,每一個企業(yè),只需要充分利用這些工具,就可以釋放無限的創(chuàng)造力和生產力。
免責聲明:本文基于已公開的資料信息或受訪人提供的信息撰寫,但解碼Decode及文章作者不保證該等信息資料的完整性、準確性。在任何情況下,本文中的信息或所表述的意見均不構成對任何人的投資建議。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。