2023中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)今天上午在貴陽市開幕。本屆數(shù)博會(huì)以“數(shù)實(shí)相融 算啟未來”為年度主題開展峰會(huì)、展覽、大賽等活動(dòng)。5月25日,由上海張江集團(tuán)、貴州貴安發(fā)展集團(tuán)聯(lián)合承辦的人工智能大模型高端對(duì)話在貴陽國(guó)際生態(tài)會(huì)議中心舉辦,貴陽市市長(zhǎng)馬寧宇出席會(huì)議并致辭,中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民等專家在會(huì)上作主旨演講。優(yōu)刻得公司受邀參會(huì),與其他來自芯片、服務(wù)器、數(shù)據(jù)中心、行業(yè)協(xié)會(huì)等領(lǐng)域的嘉賓,圍繞“數(shù)實(shí)相融,創(chuàng)新智算”主題開展圓桌對(duì)話,共同探討數(shù)據(jù)、算力與AI大模型的技術(shù)和產(chǎn)業(yè)趨勢(shì)。
大模型引領(lǐng)了AI落地和應(yīng)用的新篇章,云計(jì)算為大模型的快速發(fā)展提供所需的智算基礎(chǔ)設(shè)施支撐。UCloud優(yōu)刻得副總裁劉杰認(rèn)為,國(guó)內(nèi)大模型的發(fā)展存在算力、數(shù)據(jù)、算法和工程四個(gè)方面的挑戰(zhàn)。
在算力層面,訓(xùn)練大模型需要龐大的計(jì)算集群和高性能的硬件設(shè)備。隨著模型規(guī)模的增加,所需的算力也會(huì)相應(yīng)增加。目前國(guó)內(nèi)大模型因?yàn)榻鄣仍蛎媾R高端算力芯片供給不足,同時(shí)國(guó)產(chǎn)算力芯片形成規(guī)?;瘧?yīng)用能力還需要一定時(shí)間。
在數(shù)據(jù)層面,大模型需要大規(guī)模的數(shù)據(jù)集進(jìn)行訓(xùn)練,數(shù)據(jù)的多樣性和廣覆蓋,對(duì)于模型的性能至關(guān)重要。目前,國(guó)內(nèi)基于中文語義的大模型訓(xùn)練所需要的中文數(shù)據(jù)總量不夠,且質(zhì)量不高,同時(shí)數(shù)據(jù)流通還面臨信息安全等問題。
在算法層面,大模型的訓(xùn)練涉及上千億參數(shù),需要高效的算法來加速和優(yōu)化模型性能。千億模型的混合精度訓(xùn)練性能不穩(wěn)定且調(diào)試?yán)щy,而傳統(tǒng)的機(jī)器學(xué)習(xí)算法和模型結(jié)構(gòu),難以有效地?cái)U(kuò)展到大模型訓(xùn)練。
在工程層面,大模型訓(xùn)練需要數(shù)千張甚至上萬張卡同時(shí)進(jìn)行計(jì)算,涉及到基礎(chǔ)設(shè)施的性能、網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì)等,以確保高性能、可擴(kuò)展性和可靠性,工程化的實(shí)踐非常難。
當(dāng)前,UCloud正通過全棧云計(jì)算技術(shù)能力和工程實(shí)踐能力,為AI大模型提供安全可靠的智算基礎(chǔ)設(shè)施服務(wù)。
在算力方面,基于“東數(shù)西算”兩大自建數(shù)據(jù)中心——內(nèi)蒙古烏蘭察布數(shù)據(jù)中心和上海青浦?jǐn)?shù)據(jù)中心,UCloud為大模型訓(xùn)練和應(yīng)用提供低成本、高附加值的算力服務(wù)。UCloud自建數(shù)據(jù)中心內(nèi)部署了GPU高性能計(jì)算產(chǎn)品,上線了NVIDIA的V100S等多款顯卡,,A800也即將上線,滿足大模型用戶在多場(chǎng)景下的GPU加速需求。值得一提的是,位于西部的烏蘭察布數(shù)據(jù)中心電力價(jià)格相對(duì)較低,可為大模型訓(xùn)練降低30%-50%的運(yùn)營(yíng)成本。
面對(duì)大模型落地的私有化場(chǎng)景,UCloud還推出了全棧私有云解決方案,基于 UCloudStack 私有云、UCloudStor 分布式存儲(chǔ)及 USDP 智能大數(shù)據(jù)平臺(tái)等,構(gòu)建安全穩(wěn)定的私有化大模型基礎(chǔ)設(shè)施。
在數(shù)據(jù)方面,為降低數(shù)據(jù)存儲(chǔ)成本,UCloud在數(shù)據(jù)中心內(nèi)部署了新一代歸檔存儲(chǔ)產(chǎn)品US3,相較標(biāo)準(zhǔn)存儲(chǔ)降低80%存儲(chǔ)成本,為大模型訓(xùn)練需要的海量語料數(shù)據(jù)存儲(chǔ)和備份,提供更具性價(jià)比的解決方案。在數(shù)據(jù)流通環(huán)節(jié),UCloud數(shù)據(jù)安全流通平臺(tái)安全屋,將數(shù)據(jù)所有權(quán)和使用權(quán)分離,采用可信數(shù)據(jù)沙箱、安全多方計(jì)算、聯(lián)邦學(xué)習(xí)等多種技術(shù),保障數(shù)據(jù)可用不可見,可用不可拿,促進(jìn)數(shù)據(jù)要素的流通,讓更多專業(yè)性、稀有性、獨(dú)特性數(shù)據(jù)釋放價(jià)值。
在工程方面,作為一家創(chuàng)業(yè)型的云計(jì)算公司,UCloud擁有從數(shù)據(jù)中心、服務(wù)器、到計(jì)算、存儲(chǔ)網(wǎng)絡(luò)、安全、架構(gòu)設(shè)計(jì)等全方面的資源積累和技術(shù)積累,可以為大模型行業(yè)快速構(gòu)建穩(wěn)定可靠的基礎(chǔ)設(shè)施。
隨著AI行業(yè)發(fā)展,MaaS模式將成為AI應(yīng)用的全新形式且快速發(fā)展,重構(gòu)AI產(chǎn)業(yè)的商業(yè)化結(jié)構(gòu)生態(tài),激發(fā)新的產(chǎn)業(yè)鏈分工和商業(yè)模式。當(dāng)前,UCloud也在探索與達(dá)觀數(shù)據(jù)、云知聲等擁有數(shù)據(jù)和大模型的公司合作,以“大模型+大算力”的方式,為產(chǎn)業(yè)客戶提供MaaS服務(wù),降低AI應(yīng)用開發(fā)門檻,促進(jìn)大模型在產(chǎn)業(yè)場(chǎng)景中的落地。
與會(huì)嘉賓還探討了“東數(shù)西算”與大模型訓(xùn)練的關(guān)系。劉杰表示,大模型的“東數(shù)西訓(xùn)”,正是國(guó)家“東數(shù)西算”戰(zhàn)略的一部分。大模型訓(xùn)練和推理對(duì)算力需求是不一樣的,訓(xùn)練用算力對(duì)訓(xùn)練集群外部的延時(shí)不敏,完全可以放在西部地區(qū)的數(shù)據(jù)中心進(jìn)行。
劉杰表示,包括貴安、烏蘭察布在內(nèi)的西部數(shù)據(jù)中心,承載大模型訓(xùn)練具有以下優(yōu)勢(shì):一是西部地區(qū)有可靠的數(shù)據(jù)中心環(huán)境,為大模型訓(xùn)練提供一個(gè)穩(wěn)定的基礎(chǔ)設(shè)施保障;二是訓(xùn)練成本低,西部地區(qū)電力資源豐富,電價(jià)比較低;三是西部地區(qū)有大量的可再生能源、清潔能源,為大模型需要的算力提供綠色能源支持。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )