九章云極DataCanvas大模型系列成果發(fā)布

11月21日消息,11月21日,「筑基賦能 智向未來(lái)」九章云極DataCanvas大模型系列成果發(fā)布會(huì)(以下簡(jiǎn)稱(chēng)“發(fā)布會(huì)”)在北京召開(kāi),發(fā)布會(huì)上重磅發(fā)布圍繞DataCanvas Alaya九章元識(shí)大模型的開(kāi)源底層LLMOps大模型工具鏈,開(kāi)源Alaya-7B大模型系列,以及TableAgent數(shù)據(jù)分析智能體等一系列直擊應(yīng)用的大模型創(chuàng)新成果。

Alaya-7B通識(shí)&對(duì)話大模型 + LLMOps工具鏈,大模型「全家桶」重磅開(kāi)源

九章云極DataCanvas Alaya-7B系列大模型正式開(kāi)源

發(fā)布會(huì)上,九章云極DataCanvas公司自主研發(fā)的DataCanvas Alaya 九章元識(shí)大模型矩陣正式開(kāi)源一系列新成果,其中包括「Alaya-7B大模型系列」中的Alaya-7B Foundation Model通識(shí)大模型和Alaya-7B Chat Model對(duì)話大模型兩大模型,以及「LLMOps大模型工具鏈」中的LMS模型運(yùn)行工具和LMPM?提示詞管理器兩大工具。

【技術(shù)門(mén)檻更低,算力消耗更少的Alaya-7B】

九章云極DataCanvas 公司副總裁于建崗介紹,Alaya-7B大模型系列是DataCanvas Alaya九章元識(shí)大模型矩陣的成員之一,基于Alaya通識(shí)大模型,由自我采集、精心篩選處理的萬(wàn)億token數(shù)據(jù)集(包含網(wǎng)絡(luò)上的中英文文章、新聞、百科等數(shù)據(jù)源)上從0開(kāi)始預(yù)訓(xùn)練而成。在此前參與的C-Eval、CMMLU、AGIEval、?MMLU、BBH等權(quán)威大模型評(píng)測(cè)榜單中,Alaya-7B均表現(xiàn)出業(yè)內(nèi)領(lǐng)先水準(zhǔn)。

Alaya-7B Chat Model 是Alaya-7B Foundation Model的對(duì)話版本,通過(guò)在精心選擇的微調(diào)數(shù)據(jù)集上進(jìn)行微調(diào),并對(duì)基于涉毒、涉黃以及不良偏見(jiàn)數(shù)據(jù)進(jìn)行去毒,從而生成和人類(lèi)價(jià)值觀對(duì)齊的對(duì)話式大模型。Alaya-7B Chat Model具備多輪對(duì)話、自我認(rèn)知和偏見(jiàn)拒答的能力,能夠完成知識(shí)問(wèn)答、代碼編寫(xiě)、信息提取、閱讀理解、創(chuàng)意寫(xiě)作等多項(xiàng)語(yǔ)言任務(wù)。

于建崗稱(chēng),Alaya-7B大模型系列在保證模型表現(xiàn)的同時(shí),對(duì)使用者的安裝使用硬件要求更低、應(yīng)用技術(shù)難度更低、訓(xùn)練所需的算力資源消耗更小,有助于加速大模型在各類(lèi)行業(yè)場(chǎng)景的實(shí)際應(yīng)用。

九章云極DataCanvas LLMOps大模型工具鏈正式開(kāi)源

【全生命周期的大模型工具鏈】

LLMOps大模型工具鏈則覆蓋了大模型從訓(xùn)練、精調(diào)、壓縮、部署、推理到監(jiān)控的全生命周期過(guò)程。本次開(kāi)源兩大工具——LMS(Large?Model?Serving)模型運(yùn)行工具和LMPM (Large Model Prompt Manager) 提示詞管理器——在大模型業(yè)務(wù)賦能過(guò)程中均起著關(guān)鍵作用。

LMS模型運(yùn)行工具,能夠提高大模型的交付速度和質(zhì)量,降低大模型的運(yùn)維和運(yùn)營(yíng)成本,以及完成大模型生產(chǎn)化及服務(wù)運(yùn)營(yíng)等方面的需求。LMPM提示詞管理器,通過(guò)幫助用戶設(shè)計(jì)更好的提示詞,引導(dǎo)大模型生成更加準(zhǔn)確、可靠、符合預(yù)期的輸出內(nèi)容。該工具既可面向技術(shù)人員提供development toolkit的開(kāi)發(fā)模式,也可以面向非技術(shù)人員提供人機(jī)交互的操作模式,滿足更多人群使用大模型的需求。

九章云極DataCanvas正在不斷嘗試工具鏈、大模型和行業(yè)應(yīng)用的融合創(chuàng)新。此前,工具鏈之一DingoDB多模向量數(shù)據(jù)庫(kù),與DataCanvas Alaya九章元識(shí)大模型聯(lián)合打造了企業(yè)知識(shí)管家解決方案,賦能企業(yè)構(gòu)建高度自動(dòng)化與智能化的企業(yè)知識(shí)庫(kù),加速多模態(tài)大模型落地應(yīng)用。

從DingoDB多模向量數(shù)據(jù)庫(kù)、LMS模型運(yùn)行工具、LMPM提示詞管理器,到Alaya-7B通識(shí)+對(duì)話大模型系列,九章云極DataCanvas已經(jīng)為用戶提供了從數(shù)據(jù)管理到大模型應(yīng)用的一站式、0門(mén)檻、全鏈條開(kāi)源工具組合。

直擊最具商業(yè)價(jià)值應(yīng)用場(chǎng)景!TableAgent實(shí)現(xiàn)人人都是數(shù)據(jù)分析師

TableAgent數(shù)據(jù)分析智能體正式發(fā)布

本次發(fā)布會(huì)正式發(fā)布公測(cè)的TableAgent數(shù)據(jù)分析智能體,同樣是以DataCanvas Alaya九章元識(shí)大模型和LLMOps大模型工具鏈為基礎(chǔ)實(shí)現(xiàn)的智能體創(chuàng)新。

九章云極DataCanvas公司主任架構(gòu)師楊健介紹稱(chēng),TableAgent在Alaya元識(shí)基礎(chǔ)上進(jìn)化而來(lái),是從0到1的交互式結(jié)構(gòu)化數(shù)據(jù)分析的突破,是企業(yè)數(shù)據(jù)分析的全新方式,讓“人人都是數(shù)據(jù)分析師”得以從夢(mèng)想照進(jìn)現(xiàn)實(shí)。

TableAgent是能夠?qū)崿F(xiàn)私有化部署的企業(yè)級(jí)數(shù)據(jù)分析智能體,有非常強(qiáng)大的意圖理解能力、分析建模能力和洞察力。在充分的理解用戶意圖后,TableAgent能夠自主地利用統(tǒng)計(jì)科學(xué)、機(jī)器學(xué)習(xí)、因果推斷等高級(jí)建模技術(shù)從數(shù)據(jù)中挖掘價(jià)值,進(jìn)而提供分析觀點(diǎn)和指導(dǎo)行動(dòng)的深刻見(jiàn)解。這種啟發(fā)式和引導(dǎo)式分析能力,能夠從深度和廣度上不斷挖掘數(shù)據(jù)中的信息和價(jià)值,幫助用戶完成高質(zhì)量的分析工作。

TableAgent數(shù)據(jù)分析智能體特性優(yōu)勢(shì)

同時(shí),得益于自有大模型和自研T+底層體系,TableAgent能夠適用于各類(lèi)行業(yè)和專(zhuān)業(yè),實(shí)現(xiàn)對(duì)任何特定領(lǐng)域內(nèi)個(gè)性化數(shù)據(jù)分析情景下的專(zhuān)業(yè)化微調(diào)。

楊健指出,當(dāng)前市場(chǎng)呈現(xiàn)出豐富多樣的生成式AI形態(tài),撥開(kāi)一眾表面浮夸的形態(tài)和場(chǎng)景,TableAgent團(tuán)隊(duì)發(fā)現(xiàn),“數(shù)據(jù)分析”是大模型和具體業(yè)務(wù)融合的更深一步,是最能為用戶產(chǎn)生直接商業(yè)價(jià)值的核心領(lǐng)域,也將是企業(yè)真正需要沉淀的、最有業(yè)務(wù)價(jià)值的領(lǐng)域。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-11-21
九章云極DataCanvas大模型系列成果發(fā)布
筑基賦能 智向未來(lái)。

長(zhǎng)按掃碼 閱讀全文