云從科技大模型之路:昇思“黑土地”上的生態(tài)煉成記

文 | 智能相對論

作者 | 李永華

一線客戶經(jīng)理,為客戶一鍵生成周全的資產(chǎn)配置建議;

中端管理人員,獲得系統(tǒng)自動撰寫的一整套數(shù)據(jù)分析報表,快速、準(zhǔn)確授信;

金融市場的“操盤手”,能夠?qū)崟r獲取那些影響市場走勢的輿情分析;

……

這些,是金融大模型落地后,預(yù)期將給行業(yè)帶來的巨大改變——工作效率大大提升、工作成果質(zhì)量得到切實保障。

這樣的大模型,目前市面上已經(jīng)有很多廠商在積極開發(fā)。

人工智能科技企業(yè)云從科技就是其中之一。

一個月前,云從科技正式發(fā)布大模型 “從容”,“從容”將以更好的交互性能,應(yīng)用于金融、政務(wù)、交通、能源、教育、醫(yī)療、文娛等行業(yè)領(lǐng)域,其中金融等賽道將是重點布局的方向。

大模型浪潮下,像云從科技這樣在AI領(lǐng)域有深厚積累的廠商,正在實現(xiàn)大模型的快速內(nèi)測、公測、面向產(chǎn)業(yè)垂直場景落地。

而云從科技能夠快速布局、出成果,除了自身在AI技術(shù)方面的積淀,還依托于全場景AI框架昇思MindSpore的開放生態(tài)。

以開放的姿態(tài)幫助有志于大模型的開發(fā)者、廠商實現(xiàn)大模型創(chuàng)新,昇思的玩法與云從科技的成功,讓當(dāng)下全球大模型創(chuàng)新之路更明晰——“黑土地”模式正在加速促進大模型的繁榮。

AI框架價值凸顯,大模型走入“黑土地”生態(tài)繁育模式

在大模型的開發(fā)過程中,AI框架在基礎(chǔ)硬件層面對接多樣化的算力,在模型、應(yīng)用層面做到能力支撐(本身也被行業(yè)定義為AI“操作系統(tǒng)”)。在當(dāng)前,業(yè)界急切地關(guān)心一個個大模型的能力與效果如何,在技術(shù)方面最多看看參數(shù)量、計算成本等,而暫時沒有將目光放到大模型開發(fā)過程中的各種基礎(chǔ)軟件技術(shù)支撐上,導(dǎo)致AI框架價值沒有出現(xiàn)在普遍的業(yè)界視野當(dāng)中。

就在最近,人工智能框架生態(tài)峰會2023在上海舉辦,500家伙伴、行業(yè)客戶、高校、研究機構(gòu)等代表參會,圍繞AI框架如何與大模型有效融合推動大模型場景應(yīng)用,進行了系列交流和探討。

在峰會上,18家AI頭部企業(yè)、高校、科研機構(gòu)、開源社區(qū)等共同發(fā)布了“共建人工智能框架生態(tài),繁榮中國人工智能產(chǎn)業(yè)”聯(lián)合倡議,要共同努力推動AI框架生態(tài)發(fā)展、推動大模型發(fā)展。

作為中國AI框架的典型代表,昇思將以開放的姿態(tài),支撐更多伙伴更好地開發(fā)與落地大模型。

以此為標(biāo)志,可以認為大模型的“黑土地”時代正式來臨。

何謂“黑土地”模式?

在其下,是堅實的地基——多樣化的算力來源都可以兼容;

在其上,是可以自由生長的物種叢林,高矮胖瘦適合各種“審美”(場景需求)的物種都可以扎根、成長。

與此對應(yīng),“黑土地”之上,AI框架的優(yōu)質(zhì)伙伴廠商就成為重要的耕耘者,最終耕耘出一片大模型繁茂的生態(tài)。

而開篇提到的云從科技,就是昇思這片黑土地上的重要耕耘者之一。

將昇思能力引入其人機協(xié)同操作系統(tǒng)(CWOS)之上,云從科技正面向政府、企業(yè)以及消費者三個大致方向進行相關(guān)大模型的產(chǎn)品落地。

這背后,是云從科技自身稟賦與昇思能力的有效結(jié)合。

因為,要最終催生優(yōu)質(zhì)大模型成果,黑土地的品質(zhì)、耕耘者的能力,都必不可少。

讓昇思這片“黑土地”物盡其用,云從科技已齊集“耕耘者”必備的三大硬實力

“黑土地”模式下,耕耘者必須具備三大條件,才能培育出有價值的大模型成果。這些,正是云從科技的稟賦所在。

1、不是“平地起高樓”,而是已經(jīng)具備AI創(chuàng)新的“基因”

大模型仍然是AI領(lǐng)域的延伸,這一大步要走的扎實,必須在AI領(lǐng)域已經(jīng)跋涉多時。

那些出彩的大模型,包括國外的ChatGPT,國內(nèi)的紫東.太初等,都基于過去長年的AI開發(fā)經(jīng)驗。

而云從科技,就是這樣一個有深厚積淀的廠商。

2015年,云從科技從中科院孵化出來,擁有全鏈AI能力,已經(jīng)在各種權(quán)威獎項中9次斬獲人工智能世界冠軍,且承建AI相關(guān)的三大國家平臺,參與眾多國家與行業(yè)標(biāo)準(zhǔn)制定。

2022年5月,云從科技完成科創(chuàng)板上市,成為科創(chuàng)板首家AI平臺公司。

在國內(nèi),云從科技是較早的將預(yù)訓(xùn)練模型應(yīng)用到具體項目中的企業(yè),在大模型走向場景應(yīng)用所需要的“下游任務(wù)精調(diào)”方面,有充分的技術(shù)儲備和實踐經(jīng)驗。

除了能力,在資源方面,云從科技還儲備了數(shù)千張卡規(guī)模的算力資源,可同步滿足3組基礎(chǔ)大模型和10組行業(yè)大模型的訓(xùn)練和調(diào)優(yōu)工作,未來還計劃擴展到上萬張卡——具備深厚的AI技術(shù)能力的云從科技,自己還打好了“地基”。

2、不是完全依賴外部經(jīng)驗輸入,而是塑造了支撐大模型的“枝干”

在AI能力沉淀的基礎(chǔ)上,云從科技還創(chuàng)新了一套適合自身能力特點的大模型“耕耘”方式。

云從科技對昇思的引入,建立在自家人機協(xié)同操作系統(tǒng)(CWOS)之上。

CWOS是一套從信息化到數(shù)字化再到智能化漸次遞進的數(shù)字化架構(gòu),致力于讓機器像人一樣思考和工作,大致可以概況為三個層面:信息化階段通過AIoT等獲取各類數(shù)據(jù),數(shù)字化階段處理數(shù)據(jù)、轉(zhuǎn)化知識,智能化階段實現(xiàn)場景的各種應(yīng)用,這其中包含有感知、認知、決策各領(lǐng)域的核心技術(shù)。

這使得CWOS與大模型天然親和,后者可以作為智能化階段的重要構(gòu)成要素(未來可能是支柱型技術(shù))。

早在今年1月,云從科技就對外宣布已經(jīng)陸續(xù)在NLP、OCR、機器視覺、語音等多個領(lǐng)域開展預(yù)訓(xùn)練大模型的實踐,其背景,就是CWOS可以無縫整合眾多技術(shù)平臺,快速入局大模型賽道。

自然,CWOS也能無縫接入昇思。

目前,云從科技與昇思聯(lián)創(chuàng)了一套基于CWOS的方案:

這個由端(信息化,獲取數(shù)據(jù))、邊(處理數(shù)據(jù)、轉(zhuǎn)化知識)、云(智能化支撐場景應(yīng)用)三重架構(gòu)組成的聯(lián)創(chuàng)自主方案,完整體現(xiàn)了CWOS一直以來的思維方式,將云從科技的能力與體系,與昇思進行了完整融合。

如此,CWOS便可以支撐更多行業(yè)平臺和應(yīng)用的通用化、智能化大腦,利用大模型能力發(fā)揮視覺、語音、NLP技術(shù)的優(yōu)勢。

3、不是盲目落地,而是有場景實踐經(jīng)驗來保證“果實”生長

在落地階段,大模型去賦能千行百業(yè),往往需要在對應(yīng)的行業(yè)、場景已經(jīng)有相關(guān)的合作與實踐。

首先,是直接的合作伙伴。

直白地說,要有行業(yè)代表性企業(yè)一起來推進,要有末端、有抓手、有路徑。

云從科技歷經(jīng)長期與各垂直領(lǐng)域企業(yè)的緊密合作,在數(shù)字政府、金融、大交通、智能制造等領(lǐng)域,可以直接聯(lián)合各行頭部企業(yè)、機構(gòu)打造不同的行業(yè)大模型,推動行業(yè)數(shù)智化建設(shè)。

然后,是數(shù)據(jù)與認知上的積累。

深入垂直行業(yè)的大模型,“大”可能不是關(guān)鍵,“?!辈鸥匾?,專有數(shù)據(jù)的運用,要賽過追求“絕對數(shù)據(jù)”。

云從科技采用的“專家知識”+“人工智能”大模型路線,在行業(yè)數(shù)據(jù)、專家知識等方面的深度儲備,為行業(yè)大模型奠定了基礎(chǔ)。

最后,是直接的應(yīng)用探索。

云從科技的大模型,在智慧政務(wù)方面為市民提供出游建議,在傳媒行業(yè)幫助提升數(shù)字人直播質(zhì)量,在教育行業(yè)減輕教師任務(wù)工作量……這些都與其長期在這些行業(yè)的AI應(yīng)用創(chuàng)新探索有直接的關(guān)系——只不過是更進一步將大模型能力融合其中。

開篇提到的金融行業(yè)大模型,同樣是云從科技重點深耕的領(lǐng)域,為此,云從科技還專門進行了長期規(guī)劃,要在2025年完成金融、智能制造、機場交通等領(lǐng)域通過大模型帶來認知能力的躍遷,讓人機協(xié)同能力更進一步。

“黑土地”夠肥沃,大模型生態(tài)才能持續(xù)繁盛

從云從科技的案例中,可以發(fā)現(xiàn)廠商自身稟賦的重要性,但昇思與CWOS的協(xié)同同樣是關(guān)鍵所在。

只有“黑土地”足夠肥沃,才能支撐起一片繁茂的生態(tài)。

好在,敢于以開放、多元、包容姿態(tài)出現(xiàn)昇思,已經(jīng)有充分的準(zhǔn)備。

首先,在技術(shù)方面,昇思已經(jīng)完成對大模型多方面的能力支撐。

在2020年的首版本中,昇思就在行業(yè)中率先推出了面向大模型自動并行特征。在持續(xù)的發(fā)展過程中,昇思一直致力于將大模型孵化過程中的系統(tǒng)工程難題集成到軟件框架中解決。較為典型的,如昇思社區(qū)已經(jīng)開源了15+個基礎(chǔ)訓(xùn)練模型以及訓(xùn)練腳本(包括常用的BLOOM、LLAMA等)。

在最新的昇思2.0版本中,大模型全流程解決方案正式推出,擁有面向大模型的眾多特性:腳本開發(fā)階段實現(xiàn)極簡易用,訓(xùn)練階段實現(xiàn)硬件資源的高效利用,場景微調(diào)階段實現(xiàn)低參微調(diào)算法的整合,部署階段實現(xiàn)算力成本的節(jié)約,等等。

然后,在實踐方面,已有“大樹”級大模型被昇思這片黑土地所孕育。

實際上,在大模型火熱的浪潮開啟之前,昇思就已經(jīng)支撐了很多知名行業(yè)大模型的發(fā)展,“黑土地”模式并不是現(xiàn)在才開始。

當(dāng)前,基于昇思孵化的大模型數(shù)量已經(jīng)超過20個。

例如,中科院研發(fā)的全模態(tài)大模型“紫東.太初2.0”,就擁有語音、圖像、文本、視頻、傳感信號、3D點云等復(fù)雜模態(tài)識別能力。

已經(jīng)啃下“硬骨頭”的昇思,在幫助云從科技等企業(yè)時,就變得更底氣。

最后,在軟硬件協(xié)同方面,昇思還實現(xiàn)了大范圍的兼容或適配。

目前,昇思面向端邊云全場景開放,已適配了國內(nèi)主流的AI芯片和硬件設(shè)備超過20款。

這使得“黑土地”可以敷設(shè)在大部分“地基”之上。

云從科技與昇思聯(lián)創(chuàng)的大模型云平臺(MaaS,用于賦能更多行業(yè)客戶創(chuàng)造屬于自己的大模型),其底層就利用到了Altas系列計算資源。

現(xiàn)在,474萬的開源社區(qū)下載量,1.3萬的社區(qū)貢獻者,5500家服務(wù)企業(yè)數(shù)量,400多個開源模型,超900篇頂會論文,昇思自身的技術(shù)能力在積極的生態(tài)建設(shè)下,還在不斷進化。

這片“黑土地”還在不斷肥沃,更多類似云從科技這樣的大模型耕耘者還將持續(xù)加入,共同繁育大模型生態(tài)。

*本文圖片均來源于網(wǎng)絡(luò)

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-06-26
云從科技大模型之路:昇思“黑土地”上的生態(tài)煉成記
云從科技大模型之路:昇思“黑土地”上的生態(tài)煉成記

長按掃碼 閱讀全文