以 AI 為核心的新科技浪潮,正在推動(dòng)新一輪的產(chǎn)業(yè)變革。各行各業(yè)都希望獲得更高性價(jià)比的算力,滿足 AI 應(yīng)用下激增的計(jì)算資源需求,實(shí)現(xiàn)降本增效,驅(qū)動(dòng)業(yè)務(wù)的創(chuàng)新和增長(zhǎng)。
在這樣的需求背景下,火山引擎全面升級(jí)了第三代云服務(wù)器。結(jié)合了火山引擎全棧自研、軟硬一體的 DPU2.0 架構(gòu)以及自研虛擬化全卸載技術(shù),可實(shí)現(xiàn)算力零損耗,讓升級(jí)后的第三代云服務(wù)器具備超強(qiáng)算力、超高網(wǎng)絡(luò)及更強(qiáng)存儲(chǔ) I/O 性能。
第三代云服務(wù)器各項(xiàng)性能較上一代有大幅提升,重點(diǎn)升級(jí)發(fā)布了通用型實(shí)例 g3i、高主頻實(shí)例 hfr3i,以及國(guó)內(nèi)業(yè)界首創(chuàng)的彈性預(yù)約實(shí)例,為客戶不同應(yīng)用場(chǎng)景提供更優(yōu)性價(jià)比的新選擇。
通用場(chǎng)景算力全面升級(jí),AI 降本新選擇
隨著 AI 技術(shù)的不斷發(fā)展和應(yīng)用場(chǎng)景的拓展,越來(lái)越多的大模型逐漸部署到企業(yè)的實(shí)際生產(chǎn)環(huán)境中,給企業(yè)帶來(lái)了高昂的推理成本。企業(yè)對(duì)性能強(qiáng)大且性價(jià)比更高的算力需求日益猛增。
火山引擎第三代通用型實(shí)例 g3i,相較于上代實(shí)例整機(jī)算力最高提升122%,在高性能計(jì)算、數(shù)據(jù)庫(kù)部署、Web 應(yīng)用和音視頻處理等業(yè)務(wù)場(chǎng)景下性能表現(xiàn)更加優(yōu)異,尤其是針對(duì) AI 推理領(lǐng)域?qū)崿F(xiàn)了顯著技術(shù)突破,每個(gè)內(nèi)核均內(nèi)置 AMX AI 加速功能,可勝任80億參數(shù)的模型推理,并為用戶提供即時(shí)且流暢的交互體驗(yàn)。
例如,文生圖是生成式 AI 中的典型應(yīng)用場(chǎng)景,在第三代通用型實(shí)例 g3i 上進(jìn)行 SDXL-Turbo 文生圖模型推理,可實(shí)現(xiàn)秒級(jí)生圖;在對(duì)話式文本生成的場(chǎng)景中,g3i 實(shí)例上進(jìn)行80億參數(shù)量的大語(yǔ)言模型的推理,首包時(shí)延能控制在1秒內(nèi)。
此外,與字節(jié)跳動(dòng)國(guó)內(nèi)各業(yè)務(wù)的潮汐資源并池,g3i 實(shí)例搭配 Spot 搶占式計(jì)費(fèi)模式,推理成本相比 A10 GPU 實(shí)例最高可降低77%,進(jìn)一步幫助企業(yè)降低成本。
單核算力提升25%,輕松應(yīng)對(duì)計(jì)算密集型場(chǎng)景
科學(xué)計(jì)算、工程計(jì)算領(lǐng)域的諸多業(yè)務(wù)場(chǎng)景,需要處理龐大的計(jì)算密集型任務(wù),單核性能更高的高主頻實(shí)例,可幫助企業(yè)降低成本,并提升設(shè)計(jì)、研發(fā)和生產(chǎn)的效率。
火山引擎新一代高主頻實(shí)例 hfr3i 提供了高達(dá) 3.4GHz 的主頻和 4.0GHz 的全核睿頻,單核算力比上一代高主頻實(shí)例提升了25%,得益于單核性能的強(qiáng)勁表現(xiàn),hfr3i 實(shí)例在算力密集場(chǎng)景下,應(yīng)用性能最高可提升30%,單 vCPU 算力性價(jià)比更是提高了15%,可滿足電子設(shè)計(jì)自動(dòng)化(EDA)、工業(yè)仿真、MMORPG 游戲、關(guān)系數(shù)據(jù)庫(kù)部署等場(chǎng)景日益增長(zhǎng)的性能需求。
例如,在 EDA 軟件應(yīng)用場(chǎng)景中,通過(guò) hfr3i 實(shí)例提供的更高單核性能,能夠在相同實(shí)例規(guī)格上運(yùn)行更多的 EDA 作業(yè),從而減少所需 vCPU 總數(shù)量,有效降低業(yè)務(wù)部署成本。同時(shí),強(qiáng)勁的單核性能還能縮短整體設(shè)計(jì)任務(wù)的耗時(shí),進(jìn)一步提升芯片設(shè)計(jì)的全流程效率。
彈性場(chǎng)景性價(jià)比首選,成本優(yōu)化27%
除了升級(jí)更高性能、更優(yōu)性價(jià)比的第三代實(shí)例以外,如何通過(guò)規(guī)模化的優(yōu)勢(shì)給企業(yè)帶來(lái)更普惠的算力資源也一直是火山引擎努力的方向。
依托于字節(jié)跳動(dòng)內(nèi)部大規(guī)模算力集群優(yōu)勢(shì),火山引擎通過(guò)和字節(jié)跳動(dòng)國(guó)內(nèi)各業(yè)務(wù)潮汐資源進(jìn)行并池、混部,以及應(yīng)用內(nèi)外硬件機(jī)型統(tǒng)一等技術(shù)手段,構(gòu)建了充沛的彈性資源池,并重磅推出業(yè)界首創(chuàng)的“彈性預(yù)約實(shí)例”售賣模式。這是一種“免費(fèi)提前預(yù)約、到點(diǎn)自動(dòng)交付”的按量計(jì)費(fèi)方式。該模式具有超高性價(jià)比,相比普通按量計(jì)費(fèi)實(shí)例,成本優(yōu)化27%以上。同時(shí)火山引擎公有云擁有百萬(wàn)級(jí)服務(wù)器、億核 CPU 規(guī)模,在高并發(fā)的情況下,以澎湃算力應(yīng)對(duì)客戶多場(chǎng)景的需求。
彈性預(yù)約實(shí)例既具備按量計(jì)費(fèi)的靈活性,又有接近包月計(jì)費(fèi)的超高性價(jià)比,尤其適用于可預(yù)見(jiàn)、有計(jì)劃的彈性資源使用場(chǎng)景,例如,游戲、在線教育、財(cái)務(wù) SaaS、電商大促以及渲染等。
火山引擎服務(wù)了某全球領(lǐng)先的云設(shè)計(jì)軟件平臺(tái)和 SaaS 服務(wù)提供商,其渲染業(yè)務(wù)高峰具有顯著的規(guī)律性與周期性。在采用火山引擎所提供的彈性預(yù)約實(shí)例后,通過(guò)接入海量資源和靈活低價(jià)的計(jì)費(fèi)方式,既保障了該公司業(yè)務(wù)高峰期資源的充分供應(yīng),又在 CPU 性能持平的情況下,使該公司總體算力成本降低了38.6%。
火山引擎第三代云服務(wù)器現(xiàn)已全面售賣,以技術(shù)驅(qū)動(dòng)的更優(yōu)性價(jià)比普惠客戶,持續(xù)為各行各業(yè)的海量云上應(yīng)用場(chǎng)景提供更加穩(wěn)定、可靠的算力支撐。
想了解更多以更優(yōu)成本落地 AI 業(yè)務(wù)的方法與實(shí)踐?
7月4日,火山引擎將攜手英特爾,以《算力再升級(jí):如何以更優(yōu)成本實(shí)現(xiàn) AI 業(yè)務(wù)落地?》為主題,對(duì)第三代通用實(shí)例 g3i、高主頻實(shí)例 hfr3i 以及彈性預(yù)約實(shí)例的應(yīng)用場(chǎng)景與實(shí)踐進(jìn)行深入解讀。
歡迎報(bào)名,預(yù)約直播!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )