百度王海峰:飛槳平臺(tái)開發(fā)者數(shù)量已達(dá)750萬(wàn)名

7月6日消息,7月6-8日,以“智聯(lián)世界 生成未來(lái)”為主題的第六屆世界人工智能大會(huì)(WAIC2023)在上海舉辦。百度CTO王海峰在會(huì)上首次披露了飛槳深度學(xué)習(xí)平臺(tái)最新數(shù)據(jù)。據(jù)王海峰現(xiàn)場(chǎng)透露,截至目前,飛槳已凝聚750萬(wàn)名開發(fā)者。

百度自2010年起全面布局人工智能,是全球?yàn)閿?shù)不多、進(jìn)行全棧布局的人工智能公司。從昆侖芯片、飛槳深度學(xué)習(xí)平臺(tái)、文心大模型到人工智能應(yīng)用,百度在AI四層技術(shù)棧的各層都有布局。

其中,飛槳深度學(xué)習(xí)平臺(tái)位于框架層,向上支撐大模型生產(chǎn),提高模型部署效率和靈活性,向下適配各類硬件,提高硬件適配效率和降低成本。

文心大模型是飛槳模型庫(kù)的重要組成部分,以創(chuàng)新性的知識(shí)增強(qiáng)技術(shù)為核心。經(jīng)過(guò)飛槳與文心大模型的協(xié)同優(yōu)化,最新升級(jí)的文心大模型3.5的模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。

3月,百度發(fā)布大語(yǔ)言模型文心一言。文心一言是知識(shí)增強(qiáng)的大語(yǔ)言模型,首先從數(shù)萬(wàn)億數(shù)據(jù)和數(shù)千億知識(shí)中融合學(xué)習(xí)得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)和提示等技術(shù),并具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)等技術(shù)優(yōu)勢(shì)。

王海峰解讀了文心大模型3.5的核心技術(shù)創(chuàng)新,在基礎(chǔ)模型訓(xùn)練上,采用了飛槳最先進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計(jì)算策略,并采用多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布,加快了模型迭代速度,顯著提升了模型效果和安全性。

同時(shí),創(chuàng)新了多類型多階段有監(jiān)督精調(diào)、多層次多粒度獎(jiǎng)勵(lì)模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù),進(jìn)一步提升模型效果及場(chǎng)景適配能力。

在知識(shí)增強(qiáng)和檢索增強(qiáng)基礎(chǔ)上,文心大模型3.5提出了“知識(shí)點(diǎn)增強(qiáng)技術(shù)”,對(duì)用戶輸入的查詢、問(wèn)題等進(jìn)行分析理解,解析出生成答案所需要的相關(guān)知識(shí)點(diǎn),之后運(yùn)用知識(shí)圖譜和搜索引擎為這些知識(shí)點(diǎn)找到相應(yīng)答案,最后再用這些知識(shí)點(diǎn)構(gòu)造輸入給大模型的提示,為大模型注入更具體、更詳細(xì)、更專業(yè)的知識(shí)點(diǎn),顯著提升大模型對(duì)世界知識(shí)的掌握和運(yùn)用。

在推理方面,通過(guò)大規(guī)模邏輯數(shù)據(jù)構(gòu)建、邏輯知識(shí)建模、多粒度語(yǔ)義知識(shí)組合以及符號(hào)神經(jīng)網(wǎng)絡(luò)技術(shù),提升文心大模型3.5在邏輯推理、數(shù)學(xué)計(jì)算及代碼生成等任務(wù)上的表現(xiàn)。

現(xiàn)場(chǎng)王海峰展現(xiàn)了文心一言在辦公、會(huì)議、編碼等場(chǎng)景的應(yīng)用,文心一言成為工作中的“超級(jí)助理”,幫助總結(jié)工作溝通要點(diǎn),實(shí)時(shí)記錄會(huì)議內(nèi)容,形成會(huì)議議題、摘要及總結(jié)等關(guān)鍵信息,可以通過(guò)各類插件完成指令任務(wù),包括查詢?nèi)粘獭?chuàng)建會(huì)議、設(shè)置待辦、申請(qǐng)休假等,也可以在工程師編碼過(guò)程中自動(dòng)推薦和生成代碼。據(jù)悉,目前這些功能已通過(guò)智能工作平臺(tái)“如流”應(yīng)用于百度的工作流程中,幫助提升工作效率,提高決策質(zhì)量。

王海峰表示,凡是要跟語(yǔ)言文字或程序代碼打交道的應(yīng)用場(chǎng)景,都可能有文心一言的用武之地。已經(jīng)有很多在積極應(yīng)用文心一言的場(chǎng)景,例如能源、金融、教育、辦公、媒體,等等。在文心一言這類大模型產(chǎn)業(yè)落地的進(jìn)程中,可以采用“集約化生產(chǎn),平臺(tái)化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢(shì)的企業(yè)將模型生產(chǎn)的復(fù)雜過(guò)程封裝起來(lái),通過(guò)低門檻、高效率的生產(chǎn)平臺(tái),為千行百業(yè)提供大模型服務(wù)。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-07-06
百度王海峰:飛槳平臺(tái)開發(fā)者數(shù)量已達(dá)750萬(wàn)名
今年首度對(duì)外披露飛槳生態(tài)最新數(shù)據(jù)。

長(zhǎng)按掃碼 閱讀全文