2023年7月6日,世界人工智能大會在上海世博中心及世博展覽館正式拉開帷幕。在中國電信“算網一體·融創(chuàng)未來”的分論壇上,中國電信數(shù)字智能科技分公司(以下簡稱:電信智科)正式對外發(fā)布中國電信大語言模型TeleChat,并展示了大模型賦能數(shù)據(jù)中臺、智能客服和智慧政務三個方向的產品。
發(fā)布會現(xiàn)場,電信智科副總經理何忠江表示,近年來,人工智能開始爆發(fā)性增長,并進入生成式AI時代。在這過程中,人工智能從機器智能、感知智能轉化為認知智能,即通過抽象推理的方式理解自然語言。其中,GPT模型是人工智能技術發(fā)展變遷的重要代表,作為一種自然語言處理模型,GPT模型通過在大型文本語料庫上的訓練學習到語言模式用于生成自然語言文本,為信息檢索、機器翻譯和文本摘要等多類任務提供了有效的解決方案。
中國電信依托云網融合的優(yōu)勢,打造了中國電信的大語言模型TeleChat。TeleChat使用了大量高質量中英文語料進行預訓練,并采用了千萬級問答數(shù)據(jù)進行微調。同時,設計了漸進膨脹注意力機制,用于增加模型的間隔采樣,擴大實際感受野;研發(fā)了自校準微調技術,將迭代后相關性偏差作為強化學習的監(jiān)督信號,提升強化學習效果;并且利用知識圖譜協(xié)同增強策略,通過知識圖譜增強大模型的預訓練和推理能力,減少大模型幻覺現(xiàn)象。
此外,以TeleChat為底座的教育版大模型TeleChat-E在全球大模型綜合性考試評測榜單C-Eval上排名第七,前幾名包括GP4、ChatGPT等知名大模型。TeleChat-E使用人工收集、標注、整理的高質量領域數(shù)據(jù)對TeleChat進行持續(xù)效果強化。同時,TeleChat-E對Transformer Decoder的損失函數(shù)進行改進,使之更加關注題目答案的生成,提高準確率。
何忠江指出,通過大模型機制,神經網絡已經可以愈加擬人化。在當下,電信TeleChat大模型正在與千行百業(yè)的信息化解決方案進行融合,在諸多行業(yè)實現(xiàn)商業(yè)化落地。本次論壇重點展示了三個大模型賦能行業(yè)應用的產品。
一是大模型+數(shù)據(jù)中臺產品。中國電信演示了將AI能力和數(shù)據(jù)中臺深度融合,打造AI智能取數(shù)能力,基于大數(shù)據(jù)平臺生成的可視化圖表。目前已實現(xiàn)大數(shù)據(jù)中臺大模型將數(shù)據(jù)平臺的權限和脫敏能力打通,使用戶可以獲取到自己權限范圍內的數(shù)據(jù)表中脫敏后的字段值,比如姓名、電話號碼等。當進入到AI取數(shù)模塊時,用戶可以根據(jù)自身需求讓大模型生成SQL、可視化圖表和分析報告。
二是大模型+智能客服產品,TeleChat大模型能夠輔助坐席或用戶快速獲取文章和材料內的信息。在現(xiàn)場演示中可以看到,通過一站式人機融合知識中臺查看產品介紹材料,再激活大模型懸浮對話框,接下來上傳需要模型理解的文件,即可得到理解后生成的反饋。在TeleChat的幫助下,坐席無需閱讀全文找答案,既解決了模型幻覺問題,還能夠做到知識庫管理權限隔離。
三是大模型+智慧政務產品,中國電信TeleChat大模型依托5G消息,為政務客戶提供政務短信智能化多輪問答,進行行業(yè)領域的基礎語言模型訓練和領域問答能力微調,并基于領域問題反饋的強化學習,最終實現(xiàn)對行業(yè)領域專業(yè)問題的精準回答和平臺推送反饋。
在人工智能發(fā)展的巨大浪潮中,中國電信將依托云網融合優(yōu)勢,打造四級智能算力體系,圍繞行業(yè)應用需求,聯(lián)合產業(yè)鏈上下游生態(tài)合作伙伴,為千行百業(yè)量身打造定制化的行業(yè)應用大模型,促進各行業(yè)數(shù)字化、智能化轉型升級,為建設數(shù)字中國貢獻電信力量。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。