騰訊封建勝:高性能計(jì)算方興未艾,硅基光電子如火如荼

1月12日消息(九九)在日前舉行的2023中國光通信高質(zhì)量發(fā)展論壇 - 硅光技術(shù)研討會(huì)上,騰訊光網(wǎng)絡(luò)架構(gòu)師封建勝表示,硅光技術(shù)一直在以自身獨(dú)特的節(jié)奏發(fā)展,各種應(yīng)用也讓人眼花繚亂,但好消息是硅光商業(yè)化的路徑越來越清晰,可謂“亂花漸欲迷人眼,淺草才能沒馬蹄。”

封建勝介紹,騰訊從社交軟件開始發(fā)展,從QQ到微信為越來越多的人提供便捷的通訊工具。截至2022年第三季度,微信月活躍賬戶數(shù)達(dá)到13億,小程序日活躍賬戶數(shù)達(dá)到6億,視頻號(hào)日活躍賬戶達(dá)到5億,目前還在繼續(xù)增長中。在這些業(yè)務(wù)背后是騰訊龐大的數(shù)據(jù)中心在支持,騰訊數(shù)據(jù)中心分布在全球26個(gè)物理地區(qū),包括70個(gè)可用區(qū),國內(nèi)加速節(jié)點(diǎn)超過2000個(gè),海外加速節(jié)點(diǎn)超過800個(gè)。

數(shù)據(jù)中心是一個(gè)復(fù)雜的數(shù)字經(jīng)濟(jì)基礎(chǔ)設(shè)施,核心是服務(wù)器與網(wǎng)絡(luò)。目前騰訊在全球有接近200萬服務(wù)器,數(shù)據(jù)存儲(chǔ)規(guī)模超過EB級(jí)別,全球加速節(jié)點(diǎn)超過2800個(gè),帶寬儲(chǔ)備達(dá)到200T。服務(wù)器與用戶之間的連接便是光通訊網(wǎng)絡(luò),數(shù)據(jù)中心內(nèi)部的光網(wǎng)絡(luò)主要由網(wǎng)卡、交換機(jī)和光模塊等硬件組成,目前騰訊的網(wǎng)卡端口速率達(dá)2×50G、2×100G, 2×200G的網(wǎng)卡芯片正在開發(fā)中;TOR交換機(jī)交換容量為8T,核心交換機(jī)容量達(dá)25.6T;對(duì)應(yīng)的光模塊有200G 1分2線纜,200G QSFP56封裝的SR4光模塊,以及200G QSFP56封裝的FR4光模塊。

封建勝指出,在騰訊微信、小程序、視頻號(hào)等業(yè)務(wù)的背后,人工智能(AI)和機(jī)器學(xué)習(xí)(ML)等新技術(shù)發(fā)揮著越來越重要的作用。當(dāng)前視頻號(hào)的推薦越來越精準(zhǔn),這背后就是AI和ML在推動(dòng)。

封建勝進(jìn)一步指出,利用算法代替人工進(jìn)行分級(jí),推薦效率和精準(zhǔn)性都得到了很大提升,但也面臨著新的問題:滯后的硬件算力和滯后的網(wǎng)絡(luò)帶寬。最近10年,AI訓(xùn)練模型對(duì)算力的需求中,機(jī)器視覺、自然語言處理的增長速度為每兩年15倍;Transformer大模型的增長速度更是達(dá)到每兩年750倍,遠(yuǎn)遠(yuǎn)超過摩爾定律的每兩年兩倍。這意味著硬件的算力跟不上訓(xùn)練模型的需求。

不僅如此,存儲(chǔ)和互聯(lián)的速率增長速度更加緩慢。硬件算力在20年內(nèi)增長了9萬倍,內(nèi)存總線,例如DRAM 20年內(nèi)增長僅30倍,互聯(lián)帶寬在20年內(nèi)也僅增長30倍,都遠(yuǎn)遠(yuǎn)低于硬件算力的增長。

封建勝表示,互聯(lián)帶寬和硬件算力之間的鴻溝越來越大,是困境、是挑戰(zhàn),更是機(jī)遇。封建勝認(rèn)為,高性能計(jì)算是未來光通訊的重要增量場景。在過去的一年中,騰訊研發(fā)了第一臺(tái)25.6T CPO交換機(jī),在端口密度、功耗、延遲等方面都有收益,為高性能計(jì)算網(wǎng)絡(luò)的建設(shè)奠定了基礎(chǔ)。更進(jìn)一步,硅光將光電轉(zhuǎn)化部件移動(dòng)到主要的電芯片近端,利用光I/O代替電I/O,實(shí)現(xiàn)互連帶寬的快速增加,可能突破Memory Wall,“這個(gè)技術(shù)方向是我們非常看好的。”

在未來,騰訊將探索硅光在數(shù)據(jù)中心的更多應(yīng)用,400G BR4或800G BR8規(guī)格是騰訊目前正在摸索的一個(gè)方向。

硅光在數(shù)據(jù)中心的另一應(yīng)用場景,就是當(dāng)前主流計(jì)算技術(shù)消耗了太多能量,能效低。2016年AlphaGo橫空出世,全世界都在感慨人工智能、機(jī)器學(xué)習(xí)的強(qiáng)大,但卻忽略了背后的能效比較。AlphaGo的功耗是150千瓦,而人腦的功耗約為20瓦,兩者相差超7000倍。其根本原因在于,主流計(jì)算機(jī)采用的是馮·諾伊曼架構(gòu),存在馮·諾伊曼瓶頸。

最近幾年很多初創(chuàng)公司在開發(fā)近程計(jì)算芯片,積極探索如何解決這一瓶頸。封建勝認(rèn)為,最好的解決方案是存在一體,相比于電存算一體,光存算一體同樣值得探索和研究。光計(jì)算具有高帶寬、信息吞吐量大的特點(diǎn),國內(nèi)外也有不少初創(chuàng)公司在開發(fā)相關(guān)產(chǎn)品,但是數(shù)據(jù)還是存儲(chǔ)在電學(xué)領(lǐng)域,需要大量的光電、電光轉(zhuǎn)換,“或許當(dāng)光學(xué)憶阻器成熟的時(shí)候,硅光在光計(jì)算上可以發(fā)揮其全部優(yōu)勢。”封建勝說。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-01-12
騰訊封建勝:高性能計(jì)算方興未艾,硅基光電子如火如荼
騰訊封建勝:高性能計(jì)算方興未艾,硅基光電子如火如荼,C114訊 1月12日消息(九九)在日前舉行的2023中國光通信高質(zhì)量發(fā)展論壇 - 硅光技術(shù)研討會(huì)上

長按掃碼 閱讀全文