7月4日消息,周鴻祎日前在2023全球數(shù)字經(jīng)濟大會人工智能高峰論壇上發(fā)布演講,他認為大模型還是有機會,并且在中國,在產(chǎn)業(yè)側(cè)。
周鴻祎認為大模型不是所謂泡沫,而是一場新的工業(yè)革命。不能把大模型比喻為操作系統(tǒng),而是像數(shù)據(jù)庫一樣,成為每一個數(shù)字化系統(tǒng)的標配。
在中國發(fā)展大模型,應(yīng)該搭上產(chǎn)業(yè)數(shù)字化的順風(fēng)車。
下面是周鴻祎發(fā)言實錄。
《構(gòu)建“安全可信可控易用”的企業(yè)級AI大模型》
尊敬的各位領(lǐng)導(dǎo)、各位嘉賓,大家下午好!由于時間有限,下面我分享一些對人工智能大模型的應(yīng)用前景。
前幾個月大家都在討論OpenAI和中國什么時候能夠做出自己的大模型,這幾個月大模型層出不窮,我看到很多投資人開始急了。前兩天朱嘯虎和付盛在網(wǎng)上吵了一架,主題就是對很多創(chuàng)業(yè)者和公司來說,大模型的商業(yè)場景在哪里?
聽了姜局長的講話,我感覺這一頁是多余的,但在外面開會的時候還要跟人講,很多人不相信大模型是真人工智能、強人工智能或者通用人工智能,這些是我們所有討論的前提。讓我非常感慨的是,人類第一次讓計算機完整地理解人類的語言,理解語言就可以理解世界的知識和模型。
有人認為,大模型是不是像之前流行的概念一樣,就是一個風(fēng)口和泡沫?我認為應(yīng)該不是,而是一場新的工業(yè)革命。大模型直接提高每個人、每個組織的勞動生產(chǎn)力,同時實現(xiàn)了一種通用人工智能能力的賦能。
可以想一想,電腦剛發(fā)明的時候也沒有帶動工業(yè)革命,剛開始只是一些物理研究、氣象預(yù)報,高精尖的領(lǐng)域才要用到電腦,距離普通人、普通企業(yè)很遠,后來PC走入家庭和企業(yè)才改變了這個世界。行業(yè)應(yīng)該爭取這個目標,只有大模型走進千家萬戶、賦能百行千業(yè),才能真正推動人工智能帶來的這場革命。
有人覺得,模仿OpenAI的話,將來中國和全世界可能就是一兩個大模型,因此把大模型比喻為操作系統(tǒng),大部分公司可能就沒有機會了。我認為未來大模型的趨勢不會只有一個,而是會像數(shù)據(jù)庫一樣,變成每個數(shù)字化系統(tǒng)的標配,小到手機上的部署,中等規(guī)模的汽車上的部署,當然也包括在企業(yè)和政府內(nèi)部的部署。
國家當前的重要戰(zhàn)略之一是產(chǎn)業(yè)數(shù)字化,就是利用數(shù)字化技術(shù)幫助傳統(tǒng)產(chǎn)業(yè),特別是制造業(yè)賦能轉(zhuǎn)型。要在中國發(fā)展大模型就應(yīng)該順勢而為,為產(chǎn)業(yè)數(shù)字化賦能。最近我經(jīng)常出差,跟很多省市的主官交流,大家的認知是一致的,大模型真正的機會在中國,我覺得是在企業(yè)級市場,包括政府和城市,中國做大模型最應(yīng)該抓住產(chǎn)業(yè)互聯(lián)網(wǎng)發(fā)展的機會。
但是當我們帶著通用大模型API走到政府、城市和企業(yè),就會發(fā)現(xiàn)光有大模型,直接用起來是有很多問題的。光有大模型是通才,但缺乏行業(yè)深度。ChatGPT剛開始的時候很驚艷,覺得什么都能回答,但如果真的是行業(yè)專家提出很深度的問題,它的能力是有限的。行業(yè)內(nèi)部、企業(yè)內(nèi)部真正有價值的知識,公開渠道是拿不到的,光有大模型沒有辦法滿足行業(yè)和企業(yè)的場景垂直專業(yè)性的要求。
剛才朱軍院長講到,公有大模型存在很多數(shù)據(jù)安全隱患。每個企業(yè)自己內(nèi)部的Knowhow是核心資產(chǎn),肯定不會訓(xùn)練到公域大模型。公有大模型使用會有數(shù)據(jù)泄露的問題,因為很多想法和計劃都要告訴它,它才能寫出一篇好的文章。公有大模型是生成式AI,本身算法的特點就是會胡說八道,而且是一本正經(jīng)、理直氣壯地胡說八道。
這個特點用來做小說、寫劇本,作為聊天機器人逗悶子效果很不錯,但放在企業(yè)級場景問題就很大,要是真的拿醫(yī)療大模型開的藥方,你敢不敢相信?敢不敢吃?公有大模型無法實現(xiàn)成本可控,因為大模型成本之高也被渲染得很厲害,訓(xùn)練一次要一千萬美金,需要多少算力、多少顯卡,企業(yè)內(nèi)部做垂直大模型不用追求知識的全面,也不用追求能力面面俱到,百億模型可能就足夠了,千億到百億看起來參數(shù)做小了十倍,節(jié)省的訓(xùn)練和部署成本可遠遠不止十倍。
因此對很多企業(yè)來說,訓(xùn)練企業(yè)級大模型的成本已經(jīng)在急劇降低,我們的目的就是把大模型拉下神壇,變成每個企業(yè)、政府部門都感覺能夠直接使用的東西。
針對以上這些問題,我們思考一下,企業(yè)、政府、市場到底需要什么樣的大模型?可以簡單總結(jié)為五化。
行業(yè)化。一定要有行業(yè)深度訓(xùn)練的數(shù)據(jù)才有價值。
企業(yè)化。需要和企業(yè)內(nèi)部知識庫進行配合,而且做到實時迭代更新,從而保證大模型更懂企業(yè)。
垂直化。我們不要試圖用一個大模型解決所有問題,大模型未來在企業(yè)落地形態(tài)一定是多個垂直模型組合,垂直模型解決專業(yè)問題的能力更強。最近有一個謠言,大家都在感慨ChatGPT4.0很強大,可能是超萬億參數(shù)的大模型,這樣的大模型成本和微調(diào)都會比較困難,牽一發(fā)而動全身,后來有人說是八個千億模型組成,真的是這樣的話就證明模型垂直還是非常重要。
小型化。Google Lamma發(fā)展方向的趨勢就是拼命把大模型做大,不到萬億都不好意思說自己是做大模型的,但還有一個趨勢就是把大模型架構(gòu)的參數(shù)、訓(xùn)練數(shù)據(jù)集做小。一臺最新的蘋果電腦,可以運算大規(guī)模的300多億的模型。未來小規(guī)模的大模型可能也是一個趨勢,未來如果一個大模型管理自動駕駛、智能座艙,不可能在云端瞬時響應(yīng),可能每輛車都有一個大模型架構(gòu)。
專有化。中國市場不會是全部都是公有云的市場,公有云會占到一部分,很多大型央企、國企、政府機構(gòu)對Location很在意,對數(shù)據(jù)在哪里存儲看得比較重,所以專有部署能夠保證安全可控。
前幾天,我在山東參加世界互聯(lián)網(wǎng)大會,也有提出另外三個原則,就是產(chǎn)業(yè)化方案需要遵循安全、可信、可控。
安全。剛才朱軍老師已經(jīng)提到,我就不多提了,傳統(tǒng)的網(wǎng)絡(luò)安全、網(wǎng)絡(luò)攻擊、漏洞、算法安全、數(shù)據(jù)安全問題都能夠找到方法解決,最可怕的是生成內(nèi)容不安全。最早我也很鄙視別人錄屏,每次現(xiàn)場演示的時候我也忐忑不安,不知道下一句話會回答什么結(jié)果。
確實有人利用AIGC生成各種以假亂真的內(nèi)容詐騙,這種治理要比搜索引擎公眾號的管理復(fù)雜很多,所以人工智能安全問題從現(xiàn)在開始著手研究。
插播一個廣告,360也是中國第一的安全公司,我們也在做大模型,把人工智能的黑箱子打開,所以大模型也是我們要和大家一起努力攻克的方向,保證人工智能的發(fā)展底線。
可信。大家并不需要打八十分的模型,另外二十分亂說,需要百分之百準確和精確。如何解決幻覺的問題?如何解決輸出內(nèi)容準確的問題?現(xiàn)在可以通過向量數(shù)據(jù)庫、企業(yè)搜索和外部知識庫進行校正。
可控。大模型目前還有點不靠譜的情況下,政府和場景利用起來步子要小一點,不要一上來就是主駕駛、插件和函數(shù)模式。不要輕易向大模型開放API,因為這只是一個助手,最后還是要人來決策。
企業(yè)大模型如何落地找場景?我們要用好通用能力。
首先要把大模型目前最擅長、最成熟的能力用好。以現(xiàn)在的大模型為例,生成與創(chuàng)作、代碼能力、邏輯推理、知識問答,總結(jié)下來,最擅長的其實就是兩點:一個是問答對話,一個是寫作生成。政府和企業(yè)使用的時候應(yīng)該先從幾個成熟的角度切入,上來就和企業(yè)業(yè)務(wù)系統(tǒng)緊密耦合在一起,做成很復(fù)雜的應(yīng)用,我的經(jīng)驗是恐怕難以收斂。
其次是從痛點剛需選擇場景,小切口,大縱深。真正用大模型,你會天天算奧數(shù)題、腦筋急轉(zhuǎn)彎嗎?其實不會,真正需要的場景還是跟大多數(shù)人相關(guān),說明辦公場景是剛需。面向員工有企業(yè)知識搜索、知識管理和培訓(xùn),面向領(lǐng)導(dǎo)有信息決策和輿情分析,對內(nèi)有辦公生成辦公協(xié)作,對外有提高用戶體驗的智能客服。目前企業(yè)的數(shù)字化、智能化程度不高的情況下,這些場景是企業(yè)辦公的痛點,也是大模型最能夠提高效率的地方。
大模型不是萬能的,有些企業(yè)家激動地說,有了大模型,企業(yè)中的ERP、CRM都可以丟掉了,實際上很多數(shù)據(jù)庫存的核心業(yè)務(wù)是取代不了的,大模型只能打輔助。微軟給大家提供一個很好的例子,所有的場景都是副駕駛,可以給你導(dǎo)航、給你建議、給你指點,但不會亂搶方向盤。
我覺得讓大模型剛開始先開啟副駕駛模式,與現(xiàn)有的業(yè)務(wù)系統(tǒng)保持相對獨立和隔離度,做到安全可控、安全落地、快速執(zhí)行。如果非要和現(xiàn)有系統(tǒng)結(jié)合在一起,很多單位的API可能都沒有人維護了。
AI普惠。不能只給領(lǐng)導(dǎo)用,很多業(yè)務(wù)系統(tǒng)都是給領(lǐng)導(dǎo)做一個大屏展示,這當然也很重要,但人工智能真正的價值是每個人都要用得上,科技平權(quán)。很多領(lǐng)導(dǎo)問我到底怎么用人工智能賦能?我說如果企業(yè)的每個員工、每個產(chǎn)品經(jīng)理、每個業(yè)務(wù)骨干都不熟悉人工智能,沒有用過大模型,產(chǎn)生很多想法是根本不切實際的。
如果一個企業(yè)從領(lǐng)導(dǎo)到中層和基層,所有人都能夠簡單上手使用人工智能大模型的基本功能,半年以后很多人對大模型逐漸熟悉就會主動思考如何與業(yè)務(wù)系統(tǒng)結(jié)合,怎樣改善自己的工作,作為人和大模型的雙向賦能。
大模型發(fā)展要以人為本,好用、易用。老是有人渲染應(yīng)用大模型就要大裁員,搞得很多員工對大模型很抵觸。我堅決反對這個觀點,大模型目前想獨立完成一項工作還是很難的,更多的定位是人類很好的工具、知識的助手,所以大模型的發(fā)展要以人為本。
但模型真的好用嗎?各位專家可能覺得自己寫Prompt都很戰(zhàn)場,但指望變成Prompt的專家,大模型用到八九十分也很難。360的建議就是在大模型的基礎(chǔ)上跟企業(yè)一起打造有靈魂的數(shù)字助理,定義為數(shù)字員工、數(shù)字專家、數(shù)字顧問。
因為跟通用的對話框打交道還是不如跟各種業(yè)務(wù)定義的數(shù)字員工聊天符合日常習(xí)慣,我們通過數(shù)字人的方式進一步引導(dǎo)大家輕松利用大模型完成工作。數(shù)字人跟目前網(wǎng)上直播從頭到尾念固定稿子的數(shù)字人不一樣,背后一定是大模型驅(qū)動,有著專業(yè)背景和長期積累的數(shù)字助理。未來誰能把基于大模型的數(shù)字人定義好,可能是大模型在企業(yè)內(nèi)部用得好的關(guān)鍵。
最后總結(jié)一下:大模型的發(fā)展要真正和國家戰(zhàn)略相結(jié)合,一方面是要發(fā)展核心技術(shù),另一方面要找各種應(yīng)用場景。作為投資人,一個純粹的技術(shù)只有和應(yīng)用場景相結(jié)合才能創(chuàng)造持續(xù)不斷的商業(yè)價值。大模型在城市、行業(yè)、企業(yè)數(shù)字化轉(zhuǎn)型到智能化的過程中大有可為,進化迭代剛剛開始,相信未來會成為數(shù)字化系統(tǒng)的標配。
未來可能不是百模大戰(zhàn),而是萬模窮舞,無論是To B、To G還是SaaS化的企業(yè)都有很多機會。我們會和生態(tài)合作伙伴一起打造可信、可控、安全的大模型解決方案,為網(wǎng)絡(luò)強國和數(shù)字中國建設(shè)保駕護航。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預(yù)計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。