2023騰訊全球數字生態(tài)大會「行業(yè)大模型及智能應用專場」于9月7日舉行,會上,騰訊云與信通院共同發(fā)布了《行業(yè)大模型標準體系及能力架構研究報告》,參考了騰訊云在行業(yè)大模型產業(yè)應用領域的實踐和經驗,為客戶構建行業(yè)大模型提供了標準化流程、綜合評估方法,以便更好地幫助行業(yè)伙伴構建專屬大模型。
生態(tài)大會上,騰訊還首次對外公布了騰訊混元大模型進展,并宣布從技術底座、平臺能力、智能應用三大維度升級MaaS能力。基于自研騰訊混元大模型,同時支持業(yè)內20余款主流開源模型,助力客戶構建專屬大模型及智能應用,加速模型產業(yè)落地,推進“效能革命”。
隨著人工智能模型規(guī)模逐漸增大,性能顯著提升,各行各業(yè)迎來了新的發(fā)展機遇。相比于通但不精的通用大模型,更專注、更專業(yè)的行業(yè)大模型在特定產業(yè)場景具有廣泛的應用和商業(yè)創(chuàng)新價值。但行業(yè)大模型落地到真實場景里,客戶仍面臨著投入成本高、計算資源少、數據質量差、專業(yè)人才稀缺等問題?;谛袠I(yè)用戶的痛點,騰訊云與通信院開展了行業(yè)大模型標準體系及能力架構的研究,幫助企業(yè)解決行業(yè)大模型應用問題,提升企業(yè)使用大模型進行數字化轉型的效率。
建立標準化流程,指導企業(yè)建設大模型能力
行業(yè)大模型的構建,對行業(yè)數據、計算資源和部署運維等提出較高的要求,這對于很多企業(yè)來說有一定的門檻,而且當前缺乏面向行業(yè)大模型的構建方法和流程的指導方案,企業(yè)不清楚如何著手構建行業(yè)大模型?;诖藛栴},騰訊云與信通院針對垂直領域的行業(yè)大模型,建立標準化流程,指導企業(yè)建設大模型能力。
構建行業(yè)大模型首先需要對業(yè)務需求和資源進行評估,具體包括包括業(yè)務需求評估、算力層評估、 算法層評估、數據層評估和工程層評估等。
「業(yè)務需求評估」需要結合實際場景和需求,對業(yè)務數據、業(yè)務指標、業(yè)務服務方式進行明確,通過算力層、算法層、數據層和工程層的評估,確定所選用的基礎模型和精調算法,根據數據安全隱私、數據質量等問題,確定平臺適配性和訓練流。
行業(yè)數據與大模型的共建包括明確場景目標、模型選擇、訓練環(huán)境搭建、數據處理等環(huán)節(jié)。行業(yè)數據與大模型的共建,首先需要明確行業(yè)大模型實際應用場景及模型評價目標,在模型庫中選擇合適的基礎大模型,通過硬件環(huán)境的搭建和軟件平臺的構建,將數據加工為模型訓練所需數據,最后進行特定場景行業(yè)大模型的訓練共建,包括數據上傳訓練平臺、準備訓練代碼和環(huán)境、發(fā)起模型訓練任務、存儲訓練后的模型、測評訓練后的模型等關鍵環(huán)節(jié)。
行業(yè)大模型的精調與優(yōu)化部署,其中包括模型精調、模型評估、模型重訓優(yōu)化、模型聯(lián)調部署、模型應用運營等階段。行業(yè)大模型精調與優(yōu)化部署,具體根據業(yè)務需求和資源的評估情況以及對行業(yè)數據與大模型的共建,利用前期準備的特定行業(yè)特定場景數據進行大模型的訓練精調,并且對其生成的模型進行評估與多輪迭代訓練優(yōu)化。隨后對模型進行推理服務部署、服務配置、應用服務聯(lián)調,并對已上線的模型服務提供監(jiān)控、管理、運營維護等能力。
完善標準體系,全面建立能力評估指標
隨著大模型的快速興起,業(yè)界也意識到,創(chuàng)新技術的發(fā)展離不開標準化的推動,大模型標準體系的建設和完善,對于推動大模型應用落地,加速大模型與行業(yè)應用融合,促進產業(yè)向標準化、合規(guī)化、規(guī)?;较虬l(fā)展,具有重要意義。
信通院作為國家信息通信領域的重要研究機構,一直關注AI技術的發(fā)展和應用,特別是大模型技術的創(chuàng)新和推廣。聚焦基礎大模型在實際需求中的“建、用、管”等關鍵環(huán)節(jié),信通院從多個方向牽頭構建和完善大模型的標準體系,騰訊全程并深度參與整個標準工作,聚焦工程化應用,圍繞模型開發(fā)、模型能力、模型運營、模型應用、模型可信五方面形成標準指標體系,全面評估大模型的綜合水平。
金融、文旅、政務、傳媒、電信、教育、汽車等行業(yè)大模型標準和評測指標,對于推動行業(yè)大模型的高質量發(fā)展和提升用戶體驗,提升數智化水平起著關鍵作用。一方面,行業(yè)大模型標準可用于指導第三方測評機構對特定行業(yè)大模型能力的評估、驗收等工作,另外一方面,評測指標則可考察模型在各應用場景的覆蓋情況,以及在數據處理、數據合規(guī)、數據隱私和安全性等方面的表現。
“我們希望行業(yè)大模型標準體系及能力架構研究,能夠幫助行業(yè)伙伴解決如何將大模型能力“應用”到自身的行業(yè)和場景里的問題,可以更有效的解決成本、數據、安全,合規(guī)等大模型實際落地難題。通過建立標準體系,為行業(yè)大模型的建設和應用提供指引和支持。”騰訊法務副總裁江波提到。
在20多個行業(yè)落地大模型的同時,騰訊云一直都在積極參與、推動行業(yè)大模型標準建設。早在2020年,騰訊就被選舉為全國信標委人工智能分委會委員兼副秘書長,國家在推進包括人工智能新基建的過程中,騰訊作為核心成員,承擔了很多標準制定工作及技術引領作用。
前不久,騰訊云就與中國信通院共同啟動了行業(yè)大模型標準聯(lián)合推進計劃,并聯(lián)合信通院牽頭開展國內首個金融行業(yè)大模型標準,為金融行業(yè)智能化的高質量規(guī)范化發(fā)展提供重要支撐。
中國信息通信研究院云計算與大數據研究所所長何寶宏表示,隨著人工智能技術的快速發(fā)展,行業(yè)大模型已成為推動產業(yè)升級的重要驅動力。為了規(guī)范和引領行業(yè)大模型的健康、可持續(xù)發(fā)展,有必要構建行業(yè)大模型的標準體系,以科學評價大模型技術能力和應用效果。愿本次研究成果,助力大模型產業(yè)發(fā)展和生態(tài)建設。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )