智能運維丨全棧監(jiān)控,護航云上業(yè)務(wù)

原標題:智能運維丨全棧監(jiān)控,護航云上業(yè)務(wù)

自2006年至今,云計算商用領(lǐng)域已經(jīng)歷了十余載的發(fā)展。云也從概念普及進入到廣泛應(yīng)用階段,云服務(wù)變成了像水電一樣的基礎(chǔ)服務(wù),已經(jīng)是行業(yè)共識。

云發(fā)展速度快、成長空間大,監(jiān)控場景復(fù)雜

最新Gartner的報告預(yù)測到2019年公有云市場將達到2062億美元,較2018年將會增長17.3%,然而這個規(guī)模依然只占全球范圍內(nèi)IT支出的5.4%(據(jù)Gartner預(yù)測,2019年全球IT支出將達到3.8萬億美元)。從這些數(shù)據(jù)可以看出,未來相當長一段時間,云計算業(yè)務(wù)還將繼續(xù)處于快速發(fā)展階段,并且有著巨大的增長空間。

隨著云服務(wù)的快速發(fā)展,部署在云上的業(yè)務(wù)系統(tǒng)越來越多,規(guī)模也越來越大,與此同時針對云上業(yè)務(wù)系統(tǒng)的監(jiān)控也就變得越來越重要。Gartner報告顯示,盡管已經(jīng)有39%的上云企業(yè)為其系統(tǒng)定制了監(jiān)控解決方案,但整體上來說,監(jiān)控系統(tǒng)的覆蓋范圍還有很多需要完善的地方,尤其是針對混合云業(yè)務(wù)場景的監(jiān)控。

為客戶提供完整的云上系統(tǒng)監(jiān)控解決方案

調(diào)研典型上云客戶業(yè)務(wù)系統(tǒng)發(fā)現(xiàn),中大型客戶更傾向于將系統(tǒng)構(gòu)建在混合云環(huán)境之上,并依賴公有云提供的計算、網(wǎng)絡(luò)、存儲等服務(wù),來實現(xiàn)自身業(yè)務(wù)的彈性,而小型客戶則更多的直接將業(yè)務(wù)系統(tǒng)部署到云上,并且出于運維和研發(fā)成本的考慮,所依賴的云服務(wù)種類和數(shù)量越來越多。

對于一個典型的云系統(tǒng)的監(jiān)控來說,除了要關(guān)注云系統(tǒng)的模塊架構(gòu)組成外,還要關(guān)注其依賴的云服務(wù),同時從業(yè)務(wù)價值的角度出發(fā),還要關(guān)注服務(wù)的連通性和性能,當有故障的時候,需要能夠提供對應(yīng)的手段去定位和分析產(chǎn)生問題的原因。

通過分析,可以得出云上客戶對監(jiān)控的需求如下:

  • 支持云上服務(wù)監(jiān)控,如云磁盤、對象存儲、數(shù)據(jù)庫、大數(shù)據(jù)等云服務(wù)監(jiān)控。
  • 支持跨云主機或與用戶自建環(huán)境組成的混合云場景監(jiān)控。
  • 支持客戶業(yè)務(wù)系統(tǒng)以及客戶業(yè)務(wù)價值監(jiān)控,支撐客戶日常運維與運營行為。
  • 預(yù)留擴展能力,提供相應(yīng)機制或開放API接口,供其它故障處理系統(tǒng)、變更管理系統(tǒng)感知監(jiān)控目標的狀態(tài)變化,并依此構(gòu)建完整的運維體系。

實現(xiàn)思路: 服務(wù)模型屏蔽差異

標準組件提升系統(tǒng)能力

  • 構(gòu)建服務(wù)模型屏蔽服務(wù)間模型差異

云由服務(wù)提供商提供的一系列計算、存儲、AI應(yīng)用類服務(wù)組成,每種服務(wù)的業(yè)務(wù)模型都不盡相同。如虛機、塊存儲的實例模型,數(shù)據(jù)庫、緩存、容器服務(wù)的集群模型。語音識別、語音合成、人臉識別服務(wù)提供的API或API集合模型。構(gòu)建在這些云服務(wù)資源之上的系統(tǒng),由于業(yè)務(wù)場景不同,也會呈獻出或繁或簡的架構(gòu)形態(tài)。

為了應(yīng)對結(jié)構(gòu)復(fù)雜、模型多變的云上需求,提供可擴展、適應(yīng)性強的監(jiān)控能力,就需要定制出一套標準的模型出來,對上屏蔽不同云服務(wù)資源模型與客戶業(yè)務(wù)系統(tǒng)資源模型的差異,對下支撐標準監(jiān)控能力建設(shè),這就是服務(wù)管理模型。服務(wù)模型要解決如下兩個問題:

  • 抽象實體模型特征,針對云服務(wù)資源或客戶業(yè)務(wù)系統(tǒng)按功能、結(jié)構(gòu)劃分出來的具有一致性功能的實體。
  • 刻畫模型間關(guān)系,用于描述或定義不同類型的實體間層級或關(guān)聯(lián)關(guān)系,支撐不同實體間指標數(shù)據(jù)計算。
  • 圍繞服務(wù)模型構(gòu)建可伸縮監(jiān)控能力

由于服務(wù)模型屏蔽掉了業(yè)務(wù)模型的差異,在監(jiān)控能力建設(shè)方面,就可以圍繞服務(wù)模型構(gòu)建標準化的采集、計算、存儲、異常檢測、告警、可視化等能力。通過形式多樣的采集手段實現(xiàn)監(jiān)控對象指標的收集,再通過計算和模型間關(guān)系實現(xiàn)業(yè)務(wù)指標的轉(zhuǎn)換,并將對應(yīng)結(jié)果存儲起來,供后續(xù)的異常檢測分析與可視化使用。

打造從云資源到客戶業(yè)務(wù)系統(tǒng)到終端

用戶價值的全棧監(jiān)控產(chǎn)品

在標準化的監(jiān)控能力建設(shè)完成之后,要做的是細分客戶監(jiān)控場景,并針對性的打造細分場景監(jiān)控子產(chǎn)品。

用戶在使用云系統(tǒng)的整個過程可以簡化為上圖所示模型。用戶通過公共網(wǎng)絡(luò)連接到服務(wù),對應(yīng)的用戶請求通過入口服務(wù)完成轉(zhuǎn)發(fā),由具體的部署在容器、虛機或物理機上應(yīng)用服務(wù)進程完成處理并返回給用戶,當然在處理的過程中通常會涉及到不同應(yīng)用服務(wù)進程間調(diào)用和對云服務(wù)資源的調(diào)用。根據(jù)監(jiān)控的場景,將監(jiān)控的場景細分為以下幾個場景:

  • 站點監(jiān)控,監(jiān)測客戶服務(wù)的連通性與可用性,監(jiān)測分布在不同地理位置或網(wǎng)絡(luò)的用戶的訪問服務(wù)的狀態(tài)和性能。
  • 應(yīng)用(系統(tǒng))監(jiān)控,監(jiān)控應(yīng)用或系統(tǒng)的資源使用情況及健康狀態(tài),通過進程、日志、腳本、Http、端口、語義等多種手段。
  • 主機監(jiān)控,監(jiān)測應(yīng)用進程運行的主機/容器等宿主環(huán)境的資源使用情況與健康狀態(tài)。
  • 云服務(wù)監(jiān)控,監(jiān)測云上業(yè)務(wù)系統(tǒng)依賴的云服務(wù)資源狀態(tài)和性能。
  • 業(yè)務(wù)監(jiān)控,從業(yè)務(wù)價值的角度去分析對應(yīng)變化以及追蹤導(dǎo)致這些變化的可能誘因。

結(jié)束語: 擴展監(jiān)控生態(tài),護航云上業(yè)務(wù)

通過云監(jiān)控提供的實時異常檢測機制和可視化效果,不僅可以讓客戶對自身業(yè)務(wù)現(xiàn)狀、以及支撐業(yè)務(wù)的系統(tǒng)狀態(tài)了然于胸,還可以在問題發(fā)生時幫助客戶快速定位故障,保障業(yè)務(wù)價值的連續(xù)穩(wěn)定。同時,通過監(jiān)控系統(tǒng)通過預(yù)留的接口可以方便實現(xiàn)與外部自系統(tǒng)對接,與其它自動化系統(tǒng)共同構(gòu)建監(jiān)控運維生態(tài),為云上客戶業(yè)務(wù)系統(tǒng)的穩(wěn)定保駕護航。

本文介紹了我們云上監(jiān)控產(chǎn)品的愿景與設(shè)計思路,接下來,我們還會深入的介紹如何使用百度云上的監(jiān)控、運維管理產(chǎn)品來定制構(gòu)建自己的解決方案,敬請期待!

關(guān)注百度云微信公眾號,了解更多

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-02-14
智能運維丨全棧監(jiān)控,護航云上業(yè)務(wù)
調(diào)研典型上云客戶業(yè)務(wù)系統(tǒng)發(fā)現(xiàn),中大型客戶更傾向于將系統(tǒng)構(gòu)建在混合云環(huán)境之上,并依賴公有云提供的計算、網(wǎng)絡(luò)、存儲等服務(wù),來實現(xiàn)自身業(yè)務(wù)的彈性,而小型客戶則更多的直接將業(yè)務(wù)系統(tǒng)部署到云上,并且出于運維和研

長按掃碼 閱讀全文