原標題:智能運維丨全棧監(jiān)控,護航云上業(yè)務(wù)
自2006年至今,云計算商用領(lǐng)域已經(jīng)歷了十余載的發(fā)展。云也從概念普及進入到廣泛應(yīng)用階段,云服務(wù)變成了像水電一樣的基礎(chǔ)服務(wù),已經(jīng)是行業(yè)共識。
云發(fā)展速度快、成長空間大,監(jiān)控場景復(fù)雜
最新Gartner的報告預(yù)測到2019年公有云市場將達到2062億美元,較2018年將會增長17.3%,然而這個規(guī)模依然只占全球范圍內(nèi)IT支出的5.4%(據(jù)Gartner預(yù)測,2019年全球IT支出將達到3.8萬億美元)。從這些數(shù)據(jù)可以看出,未來相當長一段時間,云計算業(yè)務(wù)還將繼續(xù)處于快速發(fā)展階段,并且有著巨大的增長空間。
隨著云服務(wù)的快速發(fā)展,部署在云上的業(yè)務(wù)系統(tǒng)越來越多,規(guī)模也越來越大,與此同時針對云上業(yè)務(wù)系統(tǒng)的監(jiān)控也就變得越來越重要。Gartner報告顯示,盡管已經(jīng)有39%的上云企業(yè)為其系統(tǒng)定制了監(jiān)控解決方案,但整體上來說,監(jiān)控系統(tǒng)的覆蓋范圍還有很多需要完善的地方,尤其是針對混合云業(yè)務(wù)場景的監(jiān)控。
為客戶提供完整的云上系統(tǒng)監(jiān)控解決方案
調(diào)研典型上云客戶業(yè)務(wù)系統(tǒng)發(fā)現(xiàn),中大型客戶更傾向于將系統(tǒng)構(gòu)建在混合云環(huán)境之上,并依賴公有云提供的計算、網(wǎng)絡(luò)、存儲等服務(wù),來實現(xiàn)自身業(yè)務(wù)的彈性,而小型客戶則更多的直接將業(yè)務(wù)系統(tǒng)部署到云上,并且出于運維和研發(fā)成本的考慮,所依賴的云服務(wù)種類和數(shù)量越來越多。
對于一個典型的云系統(tǒng)的監(jiān)控來說,除了要關(guān)注云系統(tǒng)的模塊架構(gòu)組成外,還要關(guān)注其依賴的云服務(wù),同時從業(yè)務(wù)價值的角度出發(fā),還要關(guān)注服務(wù)的連通性和性能,當有故障的時候,需要能夠提供對應(yīng)的手段去定位和分析產(chǎn)生問題的原因。
通過分析,可以得出云上客戶對監(jiān)控的需求如下:
- 支持云上服務(wù)監(jiān)控,如云磁盤、對象存儲、數(shù)據(jù)庫、大數(shù)據(jù)等云服務(wù)監(jiān)控。
- 支持跨云主機或與用戶自建環(huán)境組成的混合云場景監(jiān)控。
- 支持客戶業(yè)務(wù)系統(tǒng)以及客戶業(yè)務(wù)價值監(jiān)控,支撐客戶日常運維與運營行為。
- 預(yù)留擴展能力,提供相應(yīng)機制或開放API接口,供其它故障處理系統(tǒng)、變更管理系統(tǒng)感知監(jiān)控目標的狀態(tài)變化,并依此構(gòu)建完整的運維體系。
實現(xiàn)思路: 服務(wù)模型屏蔽差異
標準組件提升系統(tǒng)能力
- 構(gòu)建服務(wù)模型屏蔽服務(wù)間模型差異
云由服務(wù)提供商提供的一系列計算、存儲、AI應(yīng)用類服務(wù)組成,每種服務(wù)的業(yè)務(wù)模型都不盡相同。如虛機、塊存儲的實例模型,數(shù)據(jù)庫、緩存、容器服務(wù)的集群模型。語音識別、語音合成、人臉識別服務(wù)提供的API或API集合模型。構(gòu)建在這些云服務(wù)資源之上的系統(tǒng),由于業(yè)務(wù)場景不同,也會呈獻出或繁或簡的架構(gòu)形態(tài)。
為了應(yīng)對結(jié)構(gòu)復(fù)雜、模型多變的云上需求,提供可擴展、適應(yīng)性強的監(jiān)控能力,就需要定制出一套標準的模型出來,對上屏蔽不同云服務(wù)資源模型與客戶業(yè)務(wù)系統(tǒng)資源模型的差異,對下支撐標準監(jiān)控能力建設(shè),這就是服務(wù)管理模型。服務(wù)模型要解決如下兩個問題:
- 抽象實體模型特征,針對云服務(wù)資源或客戶業(yè)務(wù)系統(tǒng)按功能、結(jié)構(gòu)劃分出來的具有一致性功能的實體。
- 刻畫模型間關(guān)系,用于描述或定義不同類型的實體間層級或關(guān)聯(lián)關(guān)系,支撐不同實體間指標數(shù)據(jù)計算。
- 圍繞服務(wù)模型構(gòu)建可伸縮監(jiān)控能力
由于服務(wù)模型屏蔽掉了業(yè)務(wù)模型的差異,在監(jiān)控能力建設(shè)方面,就可以圍繞服務(wù)模型構(gòu)建標準化的采集、計算、存儲、異常檢測、告警、可視化等能力。通過形式多樣的采集手段實現(xiàn)監(jiān)控對象指標的收集,再通過計算和模型間關(guān)系實現(xiàn)業(yè)務(wù)指標的轉(zhuǎn)換,并將對應(yīng)結(jié)果存儲起來,供后續(xù)的異常檢測分析與可視化使用。
打造從云資源到客戶業(yè)務(wù)系統(tǒng)到終端
用戶價值的全棧監(jiān)控產(chǎn)品
在標準化的監(jiān)控能力建設(shè)完成之后,要做的是細分客戶監(jiān)控場景,并針對性的打造細分場景監(jiān)控子產(chǎn)品。
用戶在使用云系統(tǒng)的整個過程可以簡化為上圖所示模型。用戶通過公共網(wǎng)絡(luò)連接到服務(wù),對應(yīng)的用戶請求通過入口服務(wù)完成轉(zhuǎn)發(fā),由具體的部署在容器、虛機或物理機上應(yīng)用服務(wù)進程完成處理并返回給用戶,當然在處理的過程中通常會涉及到不同應(yīng)用服務(wù)進程間調(diào)用和對云服務(wù)資源的調(diào)用。根據(jù)監(jiān)控的場景,將監(jiān)控的場景細分為以下幾個場景:
- 站點監(jiān)控,監(jiān)測客戶服務(wù)的連通性與可用性,監(jiān)測分布在不同地理位置或網(wǎng)絡(luò)的用戶的訪問服務(wù)的狀態(tài)和性能。
- 應(yīng)用(系統(tǒng))監(jiān)控,監(jiān)控應(yīng)用或系統(tǒng)的資源使用情況及健康狀態(tài),通過進程、日志、腳本、Http、端口、語義等多種手段。
- 主機監(jiān)控,監(jiān)測應(yīng)用進程運行的主機/容器等宿主環(huán)境的資源使用情況與健康狀態(tài)。
- 云服務(wù)監(jiān)控,監(jiān)測云上業(yè)務(wù)系統(tǒng)依賴的云服務(wù)資源狀態(tài)和性能。
- 業(yè)務(wù)監(jiān)控,從業(yè)務(wù)價值的角度去分析對應(yīng)變化以及追蹤導(dǎo)致這些變化的可能誘因。
結(jié)束語: 擴展監(jiān)控生態(tài),護航云上業(yè)務(wù)
通過云監(jiān)控提供的實時異常檢測機制和可視化效果,不僅可以讓客戶對自身業(yè)務(wù)現(xiàn)狀、以及支撐業(yè)務(wù)的系統(tǒng)狀態(tài)了然于胸,還可以在問題發(fā)生時幫助客戶快速定位故障,保障業(yè)務(wù)價值的連續(xù)穩(wěn)定。同時,通過監(jiān)控系統(tǒng)通過預(yù)留的接口可以方便實現(xiàn)與外部自系統(tǒng)對接,與其它自動化系統(tǒng)共同構(gòu)建監(jiān)控運維生態(tài),為云上客戶業(yè)務(wù)系統(tǒng)的穩(wěn)定保駕護航。
本文介紹了我們云上監(jiān)控產(chǎn)品的愿景與設(shè)計思路,接下來,我們還會深入的介紹如何使用百度云上的監(jiān)控、運維管理產(chǎn)品來定制構(gòu)建自己的解決方案,敬請期待!
關(guān)注百度云微信公眾號,了解更多
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。