大模型時代到來!百度文心一言率先面向全社會全面開放

8月31日消息(南山)今年堪稱大模型爆發(fā)元年。國外以ChatGPT為代表,掀起了大模型投資熱潮;國內(nèi)隨著百度文心一言在3月16日開啟邀測,一批大模型如雨后春筍般紛紛冒出,“百模大戰(zhàn)”已經(jīng)打響。

不過,國內(nèi)大模型此前均處于內(nèi)測階段,更多是圈內(nèi)人申請內(nèi)測名額,不熟悉玩法的廣大公眾基本無緣使用。從今日起,大模型正式掀開半遮的面紗,進入公眾視野:百度文心一言宣布向全社會全面開放,廣大用戶可以在應(yīng)用商店下載“文心一言APP”或登陸“文心一言官網(wǎng)”(https://yiyan.baidu.com),體驗最新版本。

這意味著大模型技術(shù)走向成熟,也意味著大模型將迎接更多新奇的眼光、有趣的靈魂、千奇百怪的應(yīng)用,從而發(fā)揮出更大的創(chuàng)造力。以百度文心一言為代表,大模型,躁起來了!

已在行業(yè)市場展現(xiàn)能力

在面向全社會全面開放前,百度文心一言一方面不斷擴大內(nèi)測范圍,加快技術(shù)迭代升級;另一方面進軍垂直行業(yè)市場,通過百度智能云千帆大模型平臺,賦能行業(yè)數(shù)智化轉(zhuǎn)型。據(jù)此前媒體報道,不到2個月時間,就有15萬家企業(yè)申請加入百度文心一言內(nèi)測。

在發(fā)布后不到半年時間里,百度文心一言取得了醒目的成績:6月迭代的文心大模型3.5版本,訓(xùn)練速度提高了2倍,推理速度提高了17倍,模型效果累計提升超過50%。而8月最新數(shù)據(jù)顯示,文心大模型訓(xùn)練速度提高至3倍,推理速度提高了30多倍。

8月升級的千帆大模型平臺,全面接入 Llama 2 全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B- Instruct、Falcon-7B 等 33 個大模型,成為國內(nèi)擁有大模型最多的平臺。接入的模型經(jīng)過千帆平臺二次性能增強,模型推理成本最高可降低50%。

技術(shù)側(cè)和市場側(cè)并跑且互相促進,使得百度文心一言整體能力愈加突出。據(jù)了解,在IDC發(fā)布的《AI大模型技術(shù)能力評估報告,2023》中,文心大模型3.5在12項指標中拿到了7個滿分,在9個國產(chǎn)大模型中,綜合評分、算法模型和行業(yè)覆蓋均為第一。

在清華大學(xué)新聞與傳播學(xué)院沈陽團隊發(fā)布的《大語言模型綜合性能評估報告》中,百度文心一言在三大維度20項指標中綜合評分國內(nèi)第一,中文語義理解排名第一,綜合表現(xiàn)超過ChatGPT 3.5。

具體到應(yīng)用方面,例如百度文心一言為國家電網(wǎng)提供大模型技術(shù),用AI幫助預(yù)測用電的高峰波谷,為電網(wǎng)調(diào)度提供建議,雙方聯(lián)合訓(xùn)練了電力行業(yè)大模型;聯(lián)合吉利汽車構(gòu)建了工廠數(shù)字化大腦,幫助其降低了30%管理運維成本,提高了20%資源利用效率,等等。

對公眾而言更重要的是,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏此前提出,“百度要做第一個用大模型把全部產(chǎn)品重做一遍的公司”。目前,百度搜索、百度地圖、小度等國民產(chǎn)品,已經(jīng)融合了百度文心一言的能力,也就是說,大量公眾其實在潛移默化中參與了“內(nèi)測”,使用大模型服務(wù)。

李彥宏相信,當(dāng)文心一言向數(shù)以億計互聯(lián)網(wǎng)用戶大規(guī)模開放服務(wù)后,能夠獲得大量真實世界中的人工反饋,這將進一步改進基礎(chǔ)模型,并以更快速度迭代文心一言,創(chuàng)造更好的用戶體驗。今天開始,百度文心一言面向全社會全面開放,能力迭代還將提速。

千億研發(fā)投資奠定基石

“百模大戰(zhàn)”的原因,是業(yè)界廣泛認識到大模型技術(shù)變革經(jīng)濟社會的巨大潛能,為了不在新一輪競爭中落后,必須參與其中??梢钥吹剑竽P偷拈_發(fā)者來自云計算、AI、通信、游戲娛樂等多個領(lǐng)域的公司和創(chuàng)業(yè)公司,可謂魚龍混雜,莫衷一是。

百度則不然。該公司多年來一直投資AI技術(shù)創(chuàng)新和大模型產(chǎn)品研發(fā),早在2019年就發(fā)布了國內(nèi)領(lǐng)先的文心大模型,基于文心大模型3.0版本訓(xùn)練的百度文心一言,則是國內(nèi)首個大語言模型。為此,近十年累計研發(fā)投入超過1400億元。其中2022 年百度核心研發(fā)費用超過214億元,占百度核心收入比例達到22.4%。

在文心大模型和文心一言背后,是百度對人工智能時代技術(shù)架構(gòu)的全新理解:IT技術(shù)棧從芯片層、操作系統(tǒng)層和應(yīng)用層,演進到芯片層、框架層、模型層和應(yīng)用層。大模型是“新IT四層架構(gòu)”中的關(guān)鍵一環(huán),但離不開其他三層架構(gòu)的支持。

百度是全球為數(shù)不多、進行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心大模型,各個層面都有領(lǐng)先業(yè)界的關(guān)鍵自研技術(shù),并深入到行業(yè)應(yīng)用賦能。這實現(xiàn)了層與層之間的反饋,推動IT架構(gòu)端到端優(yōu)化,從而大幅提升了推理、訓(xùn)練效率。

基于這一判斷,百度進行壓強式研發(fā)投資,贏得了業(yè)內(nèi)的廣泛認同。中國工程院院士鄔賀銓評價,“百度文心一言作為國內(nèi)互聯(lián)網(wǎng)巨頭布局大語言模型研發(fā)的重要一環(huán),為各行各業(yè)帶來更多的創(chuàng)新和變革,以其為代表的大語言模型正成為中國數(shù)字經(jīng)濟的新賽道?;诎俣葘χ袊幕母形蚝蛯χ袊袌龅睦斫猓嘈拍軌蜃龀霾贿d于國外公司的AI應(yīng)用。”

對公眾來說,百度文心一言的一系列能力提升更值得期待:截至2023年8月,百度文心一言熟練掌握的創(chuàng)作體裁超過了200個,內(nèi)容豐富度是發(fā)布初期的1.6倍,思維鏈長度已經(jīng)是發(fā)布初期的2.1倍,知識點覆蓋達到了發(fā)布初期的8.3倍。同期,文心一言還發(fā)布了5個原生插件:百度搜索、覽卷文檔 (基于文檔的交互插件)、E言易圖(數(shù)據(jù)洞察圖表生成插件)、說圖解畫(基于圖片的交互插件)、一鏡流影(文字生成視頻插件),文心一言支持一次同時使用3個插件。

上述各項功能,對公眾的工作、生活、娛樂各方面都可以起到較大的幫助。據(jù)悉,百度還將開放一批經(jīng)過全新重構(gòu)的AI原生應(yīng)用,讓廣大用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。

過去十多年來,智能手機改變了人類的生活、娛樂、工作方式??梢韵嘈?,未來十多年乃至數(shù)十年,大模型將再一次全面影響人類社會的運行方式。站在“上帝視角”看,以百度文心一言為代表,大模型面向全社會全面開放,將是發(fā)生這一改變的重要時間節(jié)點。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-08-31
大模型時代到來!百度文心一言率先面向全社會全面開放
大模型時代到來!百度文心一言率先面向全社會全面開放,C114訊 8月31日消息(南山)今年堪稱大模型爆發(fā)元年。國外以ChatGPT為代表,掀起了大模型投

長按掃碼 閱讀全文