云杉網(wǎng)絡(luò)DeepFlow幫助企業(yè)構(gòu)建云原生可觀測性能力

CNCF在云原生的定義中,將可觀測性(Observability)明確為一項必備要素。因此,使用云原生應(yīng)用架構(gòu),享受其帶來的效率提升時,不得不面對的是如何構(gòu)建匹配的可觀測性能力。

可觀測性并不是通過簡單使用一個工具所能具備,是需要根據(jù)企業(yè)組織、業(yè)務(wù)應(yīng)用、基礎(chǔ)設(shè)施以及已有的監(jiān)控體系的需求現(xiàn)狀,明確階段目標(biāo),伴隨著業(yè)務(wù)發(fā)展逐步建立,是一個持續(xù)發(fā)展的過程。云杉網(wǎng)絡(luò)與客戶的共同實踐,基于云原生應(yīng)用發(fā)展的現(xiàn)狀,通過DeepFlow與客戶的應(yīng)用、網(wǎng)絡(luò)、基礎(chǔ)設(shè)施整合,綜合分析各類指標(biāo)、日志以及追蹤數(shù)據(jù),形成一站式的容器化微服務(wù)可觀測性方案。

可觀測性,必須要解決以下問題:

1.在數(shù)百個服務(wù)中發(fā)現(xiàn)瓶頸:提供非采樣,秒級精度,提供HTTP/DNS/GRPC等性能指標(biāo)數(shù)據(jù)

2.在數(shù)千個訪問中追蹤應(yīng)用:提供應(yīng)用層Trace追蹤數(shù)據(jù),網(wǎng)絡(luò)層Flow追蹤數(shù)據(jù)

3.在數(shù)萬個容器中定位根因:提供全棧(API、主機、基礎(chǔ)設(shè)施)端到端指標(biāo)數(shù)據(jù)、日志數(shù)據(jù)

注意,解決上述問題,還需要零侵?jǐn)_、多維度和實時性。

云杉網(wǎng)絡(luò)DeepFlow v5.0產(chǎn)品,在NPM基礎(chǔ)上,利用classic BPF技術(shù),通過host的用戶態(tài)(零侵?jǐn)_)監(jiān)控到主機及虛機的系統(tǒng)和網(wǎng)卡流量。DeepFlow v6.0產(chǎn)品,利用eBPF技術(shù),進一步在零侵?jǐn)_的前提下獲取了應(yīng)用和sidecar的信息,擴展了多維度的能力。

過去三年時間,云杉網(wǎng)絡(luò)DeepFlow產(chǎn)品中的關(guān)鍵數(shù)據(jù)組件,經(jīng)歷了兩次重要的升級。2018年使用ES作為主要引擎,讀寫速度無法滿足實時性要求,只能為數(shù)百臺規(guī)模的業(yè)務(wù)集群實施可觀測性。

1.2020年初,DeepFlow v5.5發(fā)布,融入了深度優(yōu)化的InfluxDB作為Metrics引擎,使平臺性能提升10倍,可以解決數(shù)千臺服務(wù)器集群的可觀測性。

2.2021年12月,DeepFlow v6.0的第一個版本發(fā)布,進一步融入了深度優(yōu)化的ClickHouse作為觀測數(shù)據(jù)的OLAP,讀寫性能再提升10倍,滿足金融及互聯(lián)網(wǎng)客戶的數(shù)萬規(guī)模的集群部署。

DeepFlow容器化微服務(wù)可觀測性方案

DeepFlow提供適用于容器化微服務(wù)的可觀測性,解決云原生應(yīng)用診斷難的核心痛點。通過對全局微服務(wù)間的通信訪問、系統(tǒng)調(diào)用、平臺環(huán)境等數(shù)據(jù)進行深度分析,提供監(jiān)控告警、故障定位及風(fēng)險排查,保障業(yè)務(wù)在云原生環(huán)境中的穩(wěn)定、高效運行。

云杉網(wǎng)絡(luò)DeepFlow幫助企業(yè)構(gòu)建云原生可觀測性能力

DeepFlow可觀測性整體架構(gòu)圖

分鐘級定位問題邊界:基于容器化微服務(wù)的云原生應(yīng)用出現(xiàn)故障時,快速明確問題邊界是解決問題的第一步?;谥R圖譜、微服務(wù)調(diào)用鏈、全棧追蹤等功能組合,快速檢索到異常單元所關(guān)聯(lián)涉及到的其他維度信息和影響范圍;直觀展示系統(tǒng)、容器、虛擬主機全棧性能指標(biāo)鎖定性能洼地等。

大幅提升排障效率:排障過程并不僅是找到故障根因并修復(fù),而是從定位、根因、修復(fù)、驗證及預(yù)防一整套運維保障操作閉環(huán)。容器環(huán)境疊加微服務(wù)架構(gòu)使得排障更加復(fù)雜,需要有效地將應(yīng)用、容器平臺、系統(tǒng)調(diào)用等運維數(shù)據(jù)進行關(guān)聯(lián),且對比指標(biāo)、跟蹤以及日志特征來提高根因的準(zhǔn)確性;并通過歷史視圖、系統(tǒng)運行表現(xiàn)、修復(fù)驗證等指標(biāo)來確認(rèn)從而提升效率。

微服務(wù)可用性指標(biāo):應(yīng)用微服務(wù)化后,衡量判斷眾多微服務(wù)的質(zhì)量以及可用性是一個繁瑣的問題。涉及到不同開發(fā)團隊,設(shè)定具體指標(biāo),周期性的記錄和評估,發(fā)現(xiàn)性能洼地及熱點等等。這些工作都是要建立在數(shù)據(jù)積累的基礎(chǔ)之上,DeepFlow平臺也是基于此來進行對微服務(wù)各維度的畫像評估。通過對應(yīng)用中所涉及的幾十、上百個微服務(wù)運行的歷史指標(biāo)數(shù)據(jù)進行量化分析,在一個運行周期中,能實時監(jiān)控業(yè)務(wù)是否達到99.99%的可用性要求,并分析出潛在影響可用性的各種原因。

DeepFlow容器化微服務(wù)可觀測性方案,面向公有云K8s、容器環(huán)境。利用eBPF等新技術(shù)的零侵入特性實現(xiàn)對網(wǎng)絡(luò)、系統(tǒng)、應(yīng)用的全棧黃金指標(biāo)的采集。對服務(wù)調(diào)用鏈以及Service mesh、iptables/ipvs、NAT的逐跳鏈路追蹤,對服務(wù)訪問的零采樣全留存,并結(jié)合云資源知識圖譜和變更事件數(shù)據(jù),搭建立體化的微服務(wù)可觀測平臺。保障云及微服務(wù)業(yè)務(wù)有序可控發(fā)展。

構(gòu)建云原生可觀測性能力

云杉網(wǎng)絡(luò)提供容器化微服務(wù)可觀測免費試用版本,試用期內(nèi)免費且無限量部署采集器??上硎軜I(yè)務(wù)零侵入部署,深度體驗DeepFlow全棧鏈路追蹤等能力,為平臺開發(fā)團隊、業(yè)務(wù)開發(fā)團隊、技術(shù)運營團隊帶來一鍵部署即可享受的‘輕便體驗’,幫助企業(yè)更順暢地走上云原生之旅。

云杉網(wǎng)絡(luò)DeepFlow幫助企業(yè)構(gòu)建云原生可觀測性能力

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )