隨著大模型訓(xùn)練和計算能力的迅速增長,國際上以GPT-4為代表的大型模型訓(xùn)練產(chǎn)品熱度居高不下,而國內(nèi)的文心一言也宣布向全社會開放。然而,國內(nèi)大型模型訓(xùn)練面臨高昂的成本及主流核心部件供應(yīng)不足的限制,從而在替換和遷移方案方面存在較大掣肘。
為了解決上述問題,Intel近期推出了第二代Gaudi深度學(xué)習(xí)加速器——Habana Gaudi2。Gaudi2以其領(lǐng)先的性價比優(yōu)勢和穩(wěn)定的供應(yīng)體系,旨在成為大規(guī)模AI部署的更優(yōu)選擇。超云作為國內(nèi)專業(yè)的數(shù)據(jù)中心產(chǎn)品及服務(wù)提供商,緊跟Intel前沿技術(shù),迅速部署產(chǎn)品研發(fā)資源,正式推出了基于英特爾AI加速卡的全新產(chǎn)品——AI服務(wù)器R8868 G13。
超云R8868 G13
Gaudi2深度學(xué)習(xí)加速器在第一代Gaudi高性能架構(gòu)的基礎(chǔ)上,在多方面提升了性能和能效比,從而加速了高性能大型語言模型的運行。該加速器具備以下特點:
1、24個可編程的張量處理器核心(TPCs);
2、21個100Gbps(RoCEv2)以太網(wǎng)接口;
3、96GB的HBM2E內(nèi)存容量;
4、2.4TB/秒的總內(nèi)存帶寬;
5、48MB的片上SRAM;
6、集成了多媒體處理引擎。
Gaudi2在GPT-3的評測中也展示出了其性價比優(yōu)勢:Intel使用了384塊Gaudi2加速器,在311分鐘內(nèi)完成了訓(xùn)練,從256個加速器擴展到384個加速器,實現(xiàn)了近線性95%的性能提升。
英特爾發(fā)布Gaudi2加速器
一直以來,超云在 AI 算力領(lǐng)域扮演著重要角色,作為國內(nèi)率先推出基于 Gaudi2 產(chǎn)品方案的廠商之一,超云 AI 服務(wù)器 R8868 G13 集成了 8 塊 Gaudi2 加速卡 HL-225B,同時可支持 2 顆英特爾®第四代 Xeon EGS 系列處理器。此前,超云連續(xù)三年獲得"Intel鈦金級合作伙伴"榮譽,雙方在產(chǎn)品研發(fā)和技術(shù)突破方面保持著密切合作。本次產(chǎn)品方案的推出不僅是雙方緊密合作的有力證明,也充分展示了超云在 AI 領(lǐng)域的實力。
通過有效的產(chǎn)品部署,超云迅速為客戶提供了高質(zhì)量、高性價比的解決方案,成為國內(nèi)首家推出一體化全棧解決方案的廠商。目前,該方案正在進入測試和收尾階段,通過這一優(yōu)質(zhì)解決方案的復(fù)制,超云占據(jù)了市場先機,獲得了越來越多互聯(lián)網(wǎng)巨頭的關(guān)注和認可。
隨著大模型在各領(lǐng)域的商業(yè)化落地,大語言模型及生成式 AI 的需求不斷擴大,市場對高性價比硬件服務(wù)器的需求也隨之變得更加迫切?;?Gaudi2 的 R8868 G13 服務(wù)器,使超云在性能和性價比方面具備領(lǐng)先優(yōu)勢。
未來,超云對與英特爾的合作充滿信心,雙方將借助深化合作和技術(shù)迭代,提供更高的深度學(xué)習(xí)性能,進一步幫助客戶提升收益價值,加速國內(nèi)大模型的創(chuàng)新和迭代,推動各行業(yè)領(lǐng)域的數(shù)字經(jīng)濟發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )