要聞 | 中譯語通出席2023中國算力大會,發(fā)布西部AI語料庫與大模型

2023年8月18日至19日,由工業(yè)和信息化部、寧夏回族自治區(qū)人民政府聯(lián)合舉辦的2023中國算力大會在寧夏銀川舉行,主題為“算領(lǐng)新產(chǎn)業(yè)潮流、力賦高質(zhì)量發(fā)展”。中譯語通科技股份有限公司(簡稱“中譯語通”)副總裁張曉丹受邀出席大會,在大模型時代下的AI算力新基建分論壇發(fā)表演講,發(fā)布中譯語通“西部AI語料庫與大模型”,并代表公司出席中國聯(lián)通寧夏分公司“東數(shù)西算”生態(tài)伙伴簽約儀式。

中譯語通副總裁 張曉丹發(fā)言

“從去年11月OpenAI發(fā)布ChatGPT大模型以來,行業(yè)內(nèi)外非常關(guān)注AIGC正在帶來的變革,以大模型為代表的AIGC產(chǎn)業(yè)已經(jīng)成為算力資源需求的增長引擎。”報告伊始,張曉丹結(jié)合中譯語通作為人工智能、自然語言處理行業(yè)的重要參與者身份,分享了新技術(shù)的發(fā)展與應(yīng)用現(xiàn)狀。

談到當(dāng)下熱議的基于可信資源的多語言大模型技術(shù),她介紹說,中譯語通在2021年啟動研發(fā)多語言、多模態(tài)大模型技術(shù),并于2022年11月發(fā)布“格物”大模型。它涵蓋了多語言預(yù)訓(xùn)練模型、多語言機器翻譯超大模型、多模態(tài)預(yù)訓(xùn)練模型和多語言生成式對話大模型等四個模型,已在政務(wù)、外宣、文旅和安全等垂直領(lǐng)域?qū)崿F(xiàn)了落地應(yīng)用。

中譯語通于2022年11月發(fā)布“格物”大模型

當(dāng)前多模型、多語言相互融合技術(shù)已經(jīng)在諸多行業(yè)大展身手,中譯語通正積極探索在更多領(lǐng)域發(fā)揮我們的賦能價值,為促進我國西部地區(qū)數(shù)字經(jīng)濟快速發(fā)展貢獻力量。張曉丹表示,未來期望與更多同道者攜手推進大模型產(chǎn)業(yè)鏈發(fā)展,助力我國AIGC行業(yè)相較國外先進技術(shù)的追趕與應(yīng)用落地。

中譯語通“西部AI語料庫與大模型”發(fā)布

在分論壇上,張曉丹代表中譯語通發(fā)布了“西部AI語料庫與大模型”,寧夏回族自治區(qū)發(fā)改委二級巡視員李汶鑫與寧夏回族自治區(qū)工業(yè)和信息化廳信息化推進處處長黃彥平出席見證。

“西部AI語料庫”由100多種語言、PB級多語言多模態(tài)高質(zhì)量數(shù)據(jù)、“一帶一路”沿線國家與地區(qū)的近80億句對的高質(zhì)量平行語料以及百億級知識三元組條目構(gòu)成,覆蓋新聞、農(nóng)業(yè)、水利、科技、金融、工業(yè)等領(lǐng)域,旨在支持面向西部地區(qū)與周邊國家和地區(qū)應(yīng)用的多語言自然語言處理和多模態(tài)大模型訓(xùn)練。

“西部AI大模型”以中譯語通自主研發(fā)的“格物”大模型和多語言AI語料庫為數(shù)據(jù)基礎(chǔ),構(gòu)建了多模態(tài)、多場景、多語言感知世界、認(rèn)知世界的通用能力,涉及西部多語言生成式對話大模型、西部多語言機器翻譯超大模型、西部多語言預(yù)訓(xùn)練模型和多模態(tài)預(yù)訓(xùn)練模型四個子模型。其中,西部多語言生成式對話大模型融合上下文理解、個性化、思維鏈等高達億級規(guī)模的高質(zhì)量業(yè)務(wù)化指令,并引入領(lǐng)域?qū)<覍R和社交對抗反饋的混合強化學(xué)習(xí)技術(shù),旨在打造時效性較高、千人千面的生成式大模型。

“西部AI語料庫與大模型”的成果將落地位于寧夏中衛(wèi)的中國聯(lián)通智算中心訓(xùn)推一體樞紐節(jié)點,立足于寧夏作為“一帶一路”和中阿合作重要窗口的政策優(yōu)勢,支持西部政務(wù)、商貿(mào)、文旅等行業(yè)應(yīng)用。

中譯語通副總裁張曉丹(左三)代表公司簽約

會中,張曉丹代表公司與中國聯(lián)通寧夏分公司簽署了“東數(shù)西算”戰(zhàn)略合作協(xié)議。中譯語通由此作為重要參與者加入“東數(shù)西算”產(chǎn)業(yè)生態(tài)圈,進一步助力提升寧夏算力產(chǎn)業(yè)發(fā)展的加速度,共筑大模型產(chǎn)業(yè)鏈、創(chuàng)新鏈、生態(tài)鏈,賦能千行百業(yè)數(shù)字化、智能化轉(zhuǎn)型升級。

大會現(xiàn)場

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )