騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)召開(kāi) 騰訊云星星海發(fā)布新一代自研雙路服務(wù)器

12月20日,在騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)“下一代軟硬一體化的云計(jì)算基礎(chǔ)設(shè)施”分論壇上,騰訊云重磅發(fā)布星星海首款自研GPU服務(wù)器和星星海新一代自研雙路服務(wù)器,后者也是國(guó)內(nèi)首款搭載即將發(fā)布的第三代英特爾至強(qiáng)可擴(kuò)展處理器(Ice Lake)的雙路服務(wù)器。此外,騰訊云還分享了在云計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、運(yùn)維在軟硬一體化趨勢(shì)下的創(chuàng)新和實(shí)踐。

  星星海首款自研GPU服務(wù)器,強(qiáng)勢(shì)占據(jù)幾宗“最”

會(huì)上,騰訊云服務(wù)器與供應(yīng)鏈管理部總經(jīng)理劉裕勛表示,隨著云計(jì)算承載的業(yè)務(wù)規(guī)模越來(lái)越大,傳統(tǒng)服務(wù)器難以完全滿足云計(jì)算數(shù)據(jù)中心場(chǎng)景下對(duì)超大規(guī)模、需求多樣、高性價(jià)比、安全可靠以及軟硬件一體化等方面的要求。通過(guò)軟硬一體化的不斷發(fā)展,騰訊云可以結(jié)合開(kāi)發(fā)者的多元化需求提供更高性能、更佳性價(jià)比的體驗(yàn)。

騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)召?gòu)w???AIOiFvuiur+S6keaYn+aYn+a1t+WPkeW4g+aWsOS4gOS7o+iHqueglOWPjOi3r+acjeWKoeWZqA=="/>

(騰訊云服務(wù)器與供應(yīng)鏈管理部總經(jīng)理劉裕勛)

此次,騰訊云在深入理解業(yè)務(wù)需求的基礎(chǔ)上,重磅推出星星海首款自研GPU服務(wù)器。

在云游戲場(chǎng)景中,客戶對(duì)單卡TCO,單用戶成本非常敏感,迫切需要降低成本。但現(xiàn)存所有GPU服務(wù)器機(jī)箱長(zhǎng)度過(guò)長(zhǎng),當(dāng)遇到需要低延時(shí)邊緣部署時(shí),無(wú)法滿足需求,會(huì)出現(xiàn)單卡掛死,導(dǎo)致整機(jī)掛死的情況。

針對(duì)類(lèi)似的場(chǎng)景和業(yè)務(wù)需求,星星海首款自研GPU服務(wù)器在性能、能效、安全特性、可靠性等層面進(jìn)行了大膽的自主創(chuàng)新和突破。

在設(shè)計(jì)上,全球首創(chuàng)在同一框架內(nèi),靈活更換主板,支持多平臺(tái)兼容,使得業(yè)務(wù)在面對(duì)GPU 選擇時(shí)獲得非常充分的競(jìng)爭(zhēng)優(yōu)勢(shì);同時(shí)結(jié)合業(yè)務(wù)對(duì)PCIe帶寬要求低的特點(diǎn),支持16卡GPU+4路intel服務(wù)器,達(dá)到業(yè)界最高密度,可大幅降低單卡TCO。

在創(chuàng)新上,創(chuàng)業(yè)界最短機(jī)框,支持邊緣部署,提高帶寬穩(wěn)定性,極大降低業(yè)務(wù)延時(shí)(最高可降近百毫秒);在可用性上,這款GPU服務(wù)器的RAS特性以及PCIe熱插拔特性,使得單GPU故障對(duì)整機(jī)無(wú)影響,可用性大幅度提升。

  星星海新一代自研雙路服務(wù)器,云上建設(shè)提前享受技術(shù)紅利

隨著AI、5G、車(chē)聯(lián)網(wǎng)和物聯(lián)網(wǎng)等技術(shù)的大規(guī)模部署,企業(yè)對(duì)于算力、存儲(chǔ)等方面的要求也更加苛刻。星星海新一代自研雙路服務(wù)器是國(guó)內(nèi)首款搭載即將發(fā)布的第三代英特爾至強(qiáng)可擴(kuò)展處理器(Ice Lake)的雙路服務(wù)器,為用戶提供更高內(nèi)存帶寬,更快I/O吞吐,更強(qiáng)實(shí)例性能,并幫助用戶基于英特爾深度學(xué)習(xí)加速(英特爾DL Boost)技術(shù),獲得處理器內(nèi)置AI加速能力。

星星海新一代自研雙路服務(wù)器基于即將發(fā)布的第三代英特爾至強(qiáng)可擴(kuò)展處理器,采用英特爾的10納米制程,能夠滿足通用計(jì)算、異構(gòu)計(jì)算、裸金屬、高性能計(jì)算等全業(yè)務(wù)場(chǎng)景需求。測(cè)試數(shù)據(jù)顯示,與搭載第二代英特爾至強(qiáng)處理器的雙路服務(wù)器相比,新款服務(wù)器的浮點(diǎn)性能提高70%,同時(shí)單機(jī)最高支持的內(nèi)存可達(dá)12TB,可充分滿足大型數(shù)據(jù)庫(kù)等業(yè)務(wù)需求。

經(jīng)測(cè)試,星星海新一代自研雙路服務(wù)器通過(guò)深度優(yōu)化定制,計(jì)算密度提升50%;通過(guò)高性能散熱器和研發(fā)創(chuàng)新獨(dú)立風(fēng)道設(shè)計(jì),散熱方案支持CPU功效提升45%;基于增強(qiáng)的可靠性、可用性和可服務(wù)性(RAS)技術(shù),可多維度全覆蓋故障診斷、精細(xì)化定位等問(wèn)題明確故障,使宕機(jī)率減少50%。

面對(duì)云業(yè)務(wù)的需求, 星星海新一代自研雙路服務(wù)器大幅提升騰訊云計(jì)算矩陣戰(zhàn)略能力,為用戶提供更強(qiáng)的計(jì)算性能,實(shí)現(xiàn)彈性部署,有效降低云服務(wù)總體成本。憑借對(duì)硬件系統(tǒng)架構(gòu)設(shè)計(jì)和前瞻性基礎(chǔ)技術(shù)研究,星星海新一代自研雙路服務(wù)器可以支持未來(lái)3-5年的前瞻性架構(gòu)演變,讓云上開(kāi)發(fā)部署提前享受技術(shù)紅利。

英特爾全球大客戶總監(jiān)米琦表示:“英特爾將基于‘以數(shù)據(jù)為中心’的全面產(chǎn)品組合、強(qiáng)大合作伙伴生態(tài)系統(tǒng)和持續(xù)不斷的技術(shù)創(chuàng)新構(gòu)筑堅(jiān)實(shí)智慧云基石,一如既往地?cái)y手騰訊,共同加速智慧云計(jì)算與新基建的發(fā)展,擁抱數(shù)字經(jīng)濟(jì)。”

騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)召開(kāi) 騰訊云星星海發(fā)布新一代自研雙路服務(wù)器

(英特爾全球大客戶總監(jiān)米琦)

值得一提的是,這兩款服務(wù)器都是出自星星海硬件實(shí)驗(yàn)室,也是騰訊首個(gè)硬件工程實(shí)驗(yàn)室,該實(shí)驗(yàn)室專注于硬件系統(tǒng)架構(gòu)設(shè)計(jì)和前瞻性基礎(chǔ)技術(shù)研究。目前騰訊云星星海已經(jīng)發(fā)布了多款自研硬件產(chǎn)品,包括四款自研服務(wù)器和一款智能網(wǎng)卡,并且在計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等全線硬件產(chǎn)品領(lǐng)域申請(qǐng)超過(guò)20多項(xiàng)專利。

  軟硬一體化成趨勢(shì),騰訊云打造云計(jì)算基礎(chǔ)設(shè)施

在數(shù)據(jù)大爆發(fā)的時(shí)代背景下,云計(jì)算承載的業(yè)務(wù)規(guī)模呈現(xiàn)指數(shù)級(jí)增長(zhǎng),軟件和硬件的結(jié)合成為剛需。未來(lái),軟硬件一體化技術(shù)會(huì)進(jìn)一步發(fā)展,為用戶提供更強(qiáng)壯的基礎(chǔ)設(shè)施平臺(tái),提升云計(jì)算的性能、提高資源利用率,最終為用戶提供穩(wěn)定、更具性價(jià)比的服務(wù)。

此次分論壇上,除了發(fā)布兩款全新服務(wù)器自研硬件產(chǎn)品,在云計(jì)算軟硬一體化的大趨勢(shì)下,騰訊云還重點(diǎn)分享了在存儲(chǔ)、網(wǎng)絡(luò)和運(yùn)維等方面的具體實(shí)踐,為業(yè)界提供了更多的參考。

隨著磁存儲(chǔ)技術(shù)和工藝制程的發(fā)展,硬盤(pán)容量越來(lái)越大,故障率和故障恢復(fù)時(shí)長(zhǎng)也隨之變長(zhǎng),這會(huì)對(duì)云上開(kāi)發(fā)帶來(lái)很大的穩(wěn)定性挑戰(zhàn)。為了給開(kāi)發(fā)者提供更為穩(wěn)健的云服務(wù),騰訊云通過(guò)對(duì)硬盤(pán)來(lái)料質(zhì)量,運(yùn)營(yíng)監(jiān)控和技術(shù)創(chuàng)新等手段進(jìn)行智能化運(yùn)營(yíng)。

騰訊云服務(wù)器運(yùn)營(yíng)中心專家工程師牛犇介紹,在來(lái)料質(zhì)量方面,騰訊云采取基于業(yè)務(wù)模型的來(lái)料篩選機(jī)制,通過(guò)云業(yè)務(wù)模型與硬盤(pán)底層參數(shù)建模,分析參數(shù)統(tǒng)計(jì)分布,定制化篩選標(biāo)準(zhǔn),使得硬盤(pán)年化故障率顯著降低至1/5。在運(yùn)營(yíng)監(jiān)控方面,騰訊云的硬盤(pán)智能監(jiān)控系統(tǒng)通過(guò)多維度硬盤(pán)健康評(píng)分和AI 故障預(yù)測(cè),可使硬盤(pán)故障提前識(shí)別率提升至80%。

騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)召開(kāi) 騰訊云星星海發(fā)布新一代自研雙路服務(wù)器

(騰訊云服務(wù)器運(yùn)營(yíng)中心專家工程師牛犇)

目前,騰訊數(shù)據(jù)中心正在運(yùn)行的服務(wù)器超過(guò)100萬(wàn)臺(tái),經(jīng)統(tǒng)計(jì),硬件故障導(dǎo)致的系統(tǒng)宕機(jī)中,內(nèi)存故障占比排第一。騰訊云星星海實(shí)驗(yàn)室副總監(jiān)李志高認(rèn)為,解決數(shù)據(jù)中心服務(wù)器宕機(jī)率高的關(guān)鍵路徑是降低內(nèi)存故障率和減少內(nèi)存故障導(dǎo)致的宕機(jī)。

騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)召開(kāi) 騰訊云星星海發(fā)布新一代自研雙路服務(wù)器

(騰訊云星星海實(shí)驗(yàn)室副總監(jiān)李志高)

騰訊云通過(guò)優(yōu)化算法進(jìn)行內(nèi)存篩選、優(yōu)選X4顆粒內(nèi)存條、使能多種內(nèi)存RAS特性等方式大大提升了服務(wù)器的可靠性。此外,騰訊云也是業(yè)內(nèi)首家在云計(jì)算領(lǐng)域大規(guī)模研發(fā)部署MCA Recovery技術(shù)的云服務(wù)商,該技術(shù)能夠有效緩解不可糾正錯(cuò)誤的影響,減少40%以上內(nèi)存故障導(dǎo)致的宕機(jī)。

騰訊云的規(guī)模正在飛速發(fā)展,云網(wǎng)絡(luò)內(nèi)部網(wǎng)關(guān)及邊界網(wǎng)關(guān)帶寬性能需求也伴隨著騰訊云的規(guī)模在快速提升,云網(wǎng)絡(luò)面臨著性能壓力、運(yùn)維壓力和可運(yùn)維性方面的挑戰(zhàn)。為此,騰訊云通過(guò)可編程芯片硬件的解決方案使得網(wǎng)絡(luò)帶寬提升的同時(shí),成本縮減約為原來(lái)的三十分之一。

傳統(tǒng)網(wǎng)關(guān)升級(jí)通過(guò)冷升級(jí)的方式,依賴上聯(lián)交換機(jī)的hash能力和underlay網(wǎng)絡(luò)路由收斂時(shí)間,而騰訊云可編程芯片硬件解決方案通過(guò)單節(jié)點(diǎn)熱升級(jí)的方式,onl控制面把配置按照數(shù)據(jù)面格式固化在內(nèi)存存,利用tonfino dma控制器,升級(jí)后reload配置,整個(gè)熱升級(jí)過(guò)程可以控制在20ms之內(nèi)。

騰訊云網(wǎng)絡(luò)產(chǎn)品中心專家工程師陳曦表示,目前該項(xiàng)解決方案已經(jīng)應(yīng)用在騰訊云多個(gè)高性能的業(yè)務(wù)場(chǎng)景之中,除了騰訊內(nèi)部業(yè)務(wù)大量上云之外,也即將應(yīng)用在用戶idc和本地專有云互通、用戶idc數(shù)據(jù)遷移上云等。

騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)召開(kāi) 騰訊云星星海發(fā)布新一代自研雙路服務(wù)器

(騰訊云網(wǎng)絡(luò)產(chǎn)品中心專家工程師陳曦)

而在網(wǎng)絡(luò)存儲(chǔ)虛擬化軟硬協(xié)同方面,搭配騰訊云自研智能網(wǎng)卡能實(shí)現(xiàn)云主機(jī)鏡像(公有鏡像,自定義鏡像)全兼容,兼容現(xiàn)有騰訊云云主機(jī)各類(lèi)鏡像包括linux和windows。騰訊云容器服務(wù)TKE借助智能網(wǎng)卡推出下一代容器網(wǎng)絡(luò)方案。

據(jù)騰訊云網(wǎng)絡(luò)產(chǎn)品中心研發(fā)副總監(jiān)王亮介紹,該方案可無(wú)縫的支持和存量的云主機(jī)進(jìn)行相互熱遷移,能快速進(jìn)行云主機(jī)和容器服務(wù)部署,并且依托軟硬件協(xié)同實(shí)現(xiàn)的高密度彈性網(wǎng)卡,支持一個(gè)Pod獨(dú)占一張彈性網(wǎng)卡,不再經(jīng)過(guò)節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)議棧(defaultnamespace),極大縮短了容器訪問(wèn)鏈路,縮短了訪問(wèn)時(shí)延,并使PPS可以達(dá)到整機(jī)上限。除此之外,方案還實(shí)現(xiàn)了短鏈接場(chǎng)景下QPS相比之前容器網(wǎng)絡(luò)方案(策略路由方案,網(wǎng)橋方案)提升50%-70%;長(zhǎng)鏈接場(chǎng)景下QPS提升40%-60%。

騰訊2020 Techo Park開(kāi)發(fā)者大會(huì)召開(kāi) 騰訊云星星海發(fā)布新一代自研雙路服務(wù)器

(騰訊云網(wǎng)絡(luò)產(chǎn)品中心研發(fā)副總監(jiān)王亮)

以全新自研服務(wù)器產(chǎn)品為核心,圍繞網(wǎng)絡(luò)、存儲(chǔ)和運(yùn)維等細(xì)分領(lǐng)域提供多樣解決方案,騰訊云正通過(guò)軟硬一體化的方式,打造面向下一代的云計(jì)算基礎(chǔ)設(shè)施,為各行各業(yè)提供更優(yōu)質(zhì)的云計(jì)算服務(wù),促進(jìn)全社會(huì)的數(shù)字化轉(zhuǎn)型升級(jí)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )