6月28日,在火山引擎主辦、英偉達(dá)合作舉辦的“V-Tech體驗(yàn)創(chuàng)新科技峰會(huì)”上,火山引擎發(fā)布大模型服務(wù)平臺(tái)“火山方舟”,面向企業(yè)提供模型精調(diào)、評(píng)測(cè)、推理等全方位的平臺(tái)服務(wù)(MaaS,即Model-as-a-Service)。目前,“火山方舟”集成了百川智能、出門問(wèn)問(wèn)、復(fù)旦大學(xué)MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI(以拼音首字母排序)等多家AI科技公司及科研院所的大模型,并已啟動(dòng)邀測(cè)。
“企業(yè)使用大模型,首先要解決安全與信任問(wèn)題”,火山引擎總裁譚待表示,“火山方舟”實(shí)現(xiàn)了大模型安全互信計(jì)算,為企業(yè)客戶確保數(shù)據(jù)資產(chǎn)安全?;凇盎鹕椒街邸豹?dú)特的多模型架構(gòu),企業(yè)可同步試用多個(gè)大模型,選用更適合自身業(yè)務(wù)需要的模型組合。
圖:火山引擎總裁譚待公布“火山方舟”首批大模型合作伙伴
首創(chuàng)安全互信計(jì)算
與小模型“自產(chǎn)自用”不同的是,大模型的生產(chǎn)門檻很高,數(shù)據(jù)安全成為大模型時(shí)代的新命題。據(jù)網(wǎng)絡(luò)安全公司Cyberhaven的調(diào)查,至少有 4%的員工將企業(yè)敏感數(shù)據(jù)輸入 ChatGPT,敏感數(shù)據(jù)占輸入內(nèi)容的比例高達(dá) 11%。2023 年初,三星公司在使用 ChatGPT不到20天時(shí),就發(fā)現(xiàn)其半導(dǎo)體設(shè)備相關(guān)機(jī)密數(shù)據(jù)被泄露,并連續(xù)發(fā)生3起類似事故。
譚待認(rèn)為,企業(yè)使用大模型,最擔(dān)心的是數(shù)據(jù)泄露;如果將大模型私有化部署,企業(yè)將承擔(dān)更高的成本,模型生產(chǎn)方也會(huì)擔(dān)心知識(shí)資產(chǎn)安全?!盎鹕椒街邸钡氖滓蝿?wù),就是做好大模型使用者、提供者和云平臺(tái)可以互相信任的安全保障。
據(jù)火山引擎智能算法負(fù)責(zé)人吳迪介紹,“火山方舟”已上線了基于安全沙箱的大模型安全互信計(jì)算方案,利用計(jì)算隔離、存儲(chǔ)隔離、網(wǎng)絡(luò)隔離、流量審計(jì)等方式,實(shí)現(xiàn)了模型的機(jī)密性、完整性和可用性保證,適用于對(duì)訓(xùn)練和推理延時(shí)要求較低的客戶。
圖:火山引擎智能算法負(fù)責(zé)人吳迪介紹“安全互信計(jì)算”
吳迪表示,“火山方舟”還在探索基于NVIDIA新一代硬件支持的可信計(jì)算環(huán)境、基于聯(lián)邦學(xué)習(xí)的數(shù)據(jù)資產(chǎn)分離等多種方式的安全互信計(jì)算方案,更全面地滿足大模型在不同業(yè)務(wù)場(chǎng)景的數(shù)據(jù)安全要求。
會(huì)上,NVIDIA 開發(fā)與技術(shù)部亞太區(qū)總經(jīng)理李曦鵬表示,NVIDIA 與火山引擎過(guò)往合作成果豐碩,包括共同合作的 GPU 推理庫(kù) ByteTransformer 在 IEEE 國(guó)際并行和分布式處理大會(huì)(IPDPS 2023)上獲得最佳論文獎(jiǎng),雙方還聯(lián)合開源了高性能圖像處理加速庫(kù) CV-CUDA,并在大規(guī)模穩(wěn)定訓(xùn)練、多模型混合部署等方面的技術(shù)合作上取得成效。
未來(lái) NVIDIA 和火山引擎團(tuán)隊(duì)將繼續(xù)深化合作,包含在 NVIDIA Hopper 架構(gòu)進(jìn)行適配與優(yōu)化、機(jī)密計(jì)算、重點(diǎn)模型合作優(yōu)化、共同為重點(diǎn)客戶提供支持,以及 NeMo Framework 適配等,攜手助力大模型產(chǎn)業(yè)繁榮。
降低大模型使用成本
中國(guó)科學(xué)技術(shù)信息研究所等機(jī)構(gòu)發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,截至今年5月,國(guó)內(nèi)已公開披露的大模型數(shù)量達(dá)到79個(gè)。
大模型密集涌現(xiàn),企業(yè)面臨“選擇困難”。在吳迪看來(lái),技術(shù)發(fā)展日新月異,國(guó)內(nèi)大模型正在快速迭代,不同大模型在特定任務(wù)上各有千秋,企業(yè)不必急于綁定一家大模型,而是應(yīng)該結(jié)合自身業(yè)務(wù)場(chǎng)景,綜合評(píng)估使用效果和成本,在不同場(chǎng)景選用更具性價(jià)比的模型。
吳迪稱,訓(xùn)練大模型很昂貴,但是從長(zhǎng)期來(lái)看,模型的推理開銷會(huì)超過(guò)訓(xùn)練開銷。效果和成本的矛盾永遠(yuǎn)存在,降低推理成本會(huì)是大模型應(yīng)用落地的重要因素,“一個(gè)經(jīng)過(guò)良好精調(diào)的中小規(guī)格模型,在特定工作上的表現(xiàn)可能不亞于通用的、巨大的基座模型,而推理成本可以降低到原來(lái)的十分之一?!?/p>
資料顯示,微軟以醫(yī)學(xué)文章數(shù)據(jù)精調(diào)了生物領(lǐng)域的BioGPT-Large模型,僅有15億參數(shù),其在 PubMedQA 基準(zhǔn)測(cè)試中的準(zhǔn)確率卻優(yōu)于有著上千億乃至數(shù)千億參數(shù)的大型通用語(yǔ)言模型。
“火山方舟”提供了豐富的模型精調(diào)和評(píng)測(cè)支持。吳迪介紹,企業(yè)可以用統(tǒng)一的工作流對(duì)接多家大模型,對(duì)于復(fù)雜需求可設(shè)置高級(jí)參數(shù)、驗(yàn)證集、測(cè)試集等功能,再通過(guò)自動(dòng)化和人工評(píng)估直觀對(duì)比模型精調(diào)效果,在不同業(yè)務(wù)場(chǎng)景里還可靈活切換不同的模型,實(shí)現(xiàn)最具性價(jià)比的模型組合。這些自定義指標(biāo)和評(píng)估數(shù)據(jù)的積累,將成為企業(yè)在大模型時(shí)代寶貴的數(shù)據(jù)資產(chǎn)。
據(jù)吳迪透露,抖音集團(tuán)內(nèi)部已有十多個(gè)業(yè)務(wù)團(tuán)隊(duì)試用“火山方舟”,在代碼糾錯(cuò)等研發(fā)提效場(chǎng)景,文本分類、總結(jié)摘要等知識(shí)管理場(chǎng)景,以及數(shù)據(jù)標(biāo)注、歸因分析等方面探索,利用大模型能力促進(jìn)降本增效。這些內(nèi)部實(shí)踐在快速打磨“火山方舟”,推動(dòng)平臺(tái)能力的進(jìn)一步完善。
“火山方舟”的首批邀測(cè)企業(yè),還包括金融、汽車、消費(fèi)等眾多行業(yè)的客戶。北京銀行CIO龔偉華表示,大模型與客戶營(yíng)銷、辦公協(xié)同、數(shù)據(jù)智能的結(jié)合,在金融應(yīng)用場(chǎng)景有巨大潛力。北京銀行將與“火山方舟”合作,在算力優(yōu)化、模型精調(diào)等方面展開研究,共同推動(dòng)金融風(fēng)控、營(yíng)銷等模型應(yīng)用落地。
助力大模型“跑完最后一公里”
集成多個(gè)大模型,供客戶直接對(duì)比,“火山方舟”的多模型架構(gòu)不僅為企業(yè)提供了豐富選擇,也得到眾多大模型生產(chǎn)方的積極響應(yīng)。
ChatGLM是智譜AI推出的千億基座認(rèn)知模型,其開源版本在大模型開源領(lǐng)域極具影響力,近期智譜AI還對(duì)ChatGLM做了新升級(jí),大幅提升了模型能力。在“火山方舟”上,智譜AI提供具有競(jìng)爭(zhēng)力的大模型,火山引擎提供高性價(jià)比資源、針對(duì)不同行業(yè)的精調(diào)能力及綜合解決方案,共建安全可靠的第三方MaaS服務(wù),合力推動(dòng)各行業(yè)的智能化發(fā)展。據(jù)智譜AI CEO張鵬介紹,智譜AI在火山引擎平臺(tái)上解決了千億模型訓(xùn)練的穩(wěn)定性、性能優(yōu)化等挑戰(zhàn)。
baichuan-7B發(fā)布后在MMLU、C-Eval等中英文權(quán)威榜單中均表現(xiàn)優(yōu)異。百川智能聯(lián)合創(chuàng)始人焦可表示,作為一款授權(quán)后可免費(fèi)商用的開源大模型,開發(fā)者們可以通過(guò)baichuan-7B低成本部署模型,并根據(jù)自身需求靈活拓展模型能力,而本次與“火山方舟”的合作也將有效降低企業(yè)用戶的大模型接入門檻和使用成本,幫助更多企業(yè)輕松獲取專業(yè)服務(wù)。
MiniMax等大模型企業(yè)代表也亮相參加“火山方舟”的發(fā)布儀式。此前,MiniMax聯(lián)合創(chuàng)始人楊斌公開分享了與火山引擎的合作成果:MiniMax在火山引擎上實(shí)現(xiàn)了從月至周級(jí)別的大模型迭代速度,和指數(shù)級(jí)的用戶交互增長(zhǎng),“或許是國(guó)內(nèi)第一家在公有云上實(shí)現(xiàn)數(shù)千卡并行訓(xùn)練的公司”。MiniMax還自研了超大規(guī)模的推理平臺(tái),穩(wěn)定支撐著每天上億次的大模型推理調(diào)用。MiniMax的文本、語(yǔ)音、視覺三個(gè)模態(tài)大模型登陸“火山方舟”,是雙方合作的進(jìn)一步深化。
科研機(jī)構(gòu)同樣是推動(dòng)大模型技術(shù)發(fā)展的重要力量,復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室開發(fā)的MOSS大模型、IDEA研究院開發(fā)的姜子牙系列大模型,均是該領(lǐng)域的代表作。IDEA研究院認(rèn)知計(jì)算與自然語(yǔ)言研究中心講席科學(xué)家張家興表示,大模型生產(chǎn)方會(huì)不斷提升基礎(chǔ)模型能力,為大模型應(yīng)用完成90%-99%的工作,“火山方舟”為代表的云平臺(tái)要幫助客戶為不同場(chǎng)景精調(diào)模型,“跑完最后一公里”。張家興認(rèn)為,“在技術(shù)驅(qū)動(dòng)和需求拉動(dòng)的作用下,大模型的世界必然百花齊放”。
譚待判斷,企業(yè)使用大模型,未來(lái)可能會(huì)呈現(xiàn)“1+N”的模式:“1”是通過(guò)自研或深度合作,形成1個(gè)主力模型;由于成本和場(chǎng)景復(fù)雜多元等原因,在這個(gè)主力模型之外,還會(huì)有N個(gè)模型同時(shí)應(yīng)用。
“每一次技術(shù)的大變革,都會(huì)帶來(lái)體驗(yàn)創(chuàng)新的新機(jī)會(huì)”,譚待坦言,“火山方舟”還在起步階段,工具鏈和下游應(yīng)用插件需要持續(xù)完善。平臺(tái)還將接入更多大模型,并逐步擴(kuò)大邀測(cè)范圍,與企業(yè)客戶共建開放合作的多模型生態(tài),加速大模型在各行各業(yè)的應(yīng)用落地。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂(lè)Q3持續(xù)穩(wěn)健增長(zhǎng):總收入70.2億元,付費(fèi)用戶數(shù)1.19億
- 蘋果Q4營(yíng)收949億美元同比增6%,在華營(yíng)收微降
- 三星電子Q3營(yíng)收79萬(wàn)億韓元,營(yíng)業(yè)利潤(rùn)受一次性成本影響下滑
- 賽力斯已向華為支付23億,購(gòu)買引望10%股權(quán)
- 格力電器三季度營(yíng)收同比降超15%,凈利潤(rùn)逆勢(shì)增長(zhǎng)
- 合合信息2024年前三季度業(yè)績(jī)穩(wěn)?。籂I(yíng)收增長(zhǎng)超21%,凈利潤(rùn)增長(zhǎng)超11%
- 臺(tái)積電四季度營(yíng)收有望再攀高峰,預(yù)計(jì)超260億美元刷新紀(jì)錄
- 韓國(guó)三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。