賦能互聯(lián)網(wǎng)級運維能力 云智慧的數(shù)字化之道與術

云智慧,一家有“兩條”業(yè)務主線的企業(yè)。一明一暗,明線代表業(yè)務邏輯,遵循數(shù)字化企業(yè)發(fā)展之道,暗線代表技術傳承,為企業(yè)IT能力的升級進行賦能。在其業(yè)務邏輯中:運維,不再局限于冰涼的機房,而是支撐企業(yè)數(shù)字化轉型的控制中樞,并關乎企業(yè)各類頂級業(yè)務指標的完成。

當然,支撐云智慧業(yè)務邏輯的是其技術傳承。強大的數(shù)據(jù)分析能力,使業(yè)務運行中的任何緩慢、異常、中斷都可迅速定位并追因溯源,而商用化的AIOps能力,也可幫助運維人員化被動為主動,實現(xiàn)運維的最高理想。

10年3階段,從IT運維到業(yè)務運維

簡述云智慧的發(fā)展歷史,一直延續(xù)清晰的路徑發(fā)展。公司成立于2009年,恰逢互聯(lián)網(wǎng)經濟潮起,推出的第一款網(wǎng)絡性能監(jiān)控SaaS產品“監(jiān)控寶”,通過解決中小網(wǎng)站的可用性痛點,迅速成為現(xiàn)象級SaaS產品,在零營銷、零地推、完全依靠口碑傳播的情況下,3年之內累積30萬企業(yè)用戶,并籍此獲得了數(shù)百萬美元的A輪融資。

賦能互聯(lián)網(wǎng)級運維能力 云智慧的數(shù)字化之道與術

云智慧總裁劉洪濤

2013年,移動化、企業(yè)上云成為IT發(fā)展主旋律,云智慧進軍APM(應用性能管理)領域,推出“透視寶”。“云智慧是國內第一家實現(xiàn)端到端應用性能追蹤,并做到APM數(shù)據(jù)全量采集的企業(yè),即用戶的每一次點擊,每一條訪問路徑都可準確記錄和重現(xiàn)。”云智慧總裁劉洪濤說,云智慧APM獲得了市場的廣泛認可,并陸續(xù)完成B輪和B+輪融資。

2016年,是云智慧發(fā)展的歷史轉折點,從依靠工具化產品服務中小企業(yè)客戶,轉變?yōu)橥ㄟ^“業(yè)務運維”為大型企業(yè)用戶提供一體化運維管理解決方案,推出智能業(yè)務運維平臺DOCP(Digital Operation Central Platform),并以此為基礎將產品和服務延展至智能運維(AIOps)領域。

一明線一暗線,云智慧發(fā)展的道與術

做個形象的比喻:如果說傳統(tǒng)運維工具是螺絲刀,那么“監(jiān)控寶”就是電動螺絲刀、“透視寶”是帶診斷能力的電動工具套裝,但具有智能運維能力的“DOCP平臺”再度升級成為綜合維修中心。

“北美用戶自身具有較強的IT能力,更愿意采購工具類產品,而中國用戶則希望借助‘平臺+服務’整體解決具體業(yè)務場景中的全部問題。”劉洪濤說,“這是云智慧用過去八年時間,因循數(shù)字化經濟發(fā)展的趨勢,不斷探索、積累,逐步發(fā)展起來的業(yè)務運維之道。”

賦能互聯(lián)網(wǎng)級運維能力 云智慧的數(shù)字化之道與術

云智慧DOCP產品和解決方案矩陣

當然,云智慧的發(fā)展還延續(xù)一條暗線,即始終遵循“數(shù)據(jù)基因”為企業(yè)提供運維服務。超海量數(shù)據(jù)采集和實時處理能力,已經成為云智慧產品的競爭優(yōu)勢和差異化特征。因為,只有數(shù)據(jù)才能揭示用戶行為的業(yè)務邏輯,基于業(yè)務數(shù)據(jù)的運維服務,才可上升至業(yè)務層面。

當然,從業(yè)務運維進一步演進到AIOps領域,更需要完備的平臺體系進行支撐,而云智慧也不斷把更先進的ABC(A即AI、B即Big Data、C即Cloud)基因融入業(yè)務運維之道,形成更有效、更貼合企業(yè)發(fā)展需求的數(shù)字化轉型之術。

何為業(yè)務運維?

回顧歷史只是為了梳理云智慧的業(yè)務傳承、技術傳承,而本文則更關注現(xiàn)階段該公司的戰(zhàn)略重點,即運維如何與業(yè)務產生關聯(lián)?又如何支撐企業(yè)數(shù)字化轉型?

互聯(lián)網(wǎng)企業(yè)的IT系統(tǒng)就是業(yè)務系統(tǒng),所以IT系統(tǒng)運維就是業(yè)務系統(tǒng)運維。傳統(tǒng)企業(yè)從互聯(lián)網(wǎng)+轉型開始學習此模式將近十年,到了數(shù)字化時代的挑戰(zhàn)反而越來越大。為何?

首先,能力不足,思維不同。傳統(tǒng)企業(yè)的運維部門,其能力難以支撐互聯(lián)網(wǎng)級別的業(yè)務運維。數(shù)字化不能局限于傳統(tǒng)運維的機房之內,其考核指標也不是設備故障率,而是銷售收入、客戶轉化率、成本控制、風險管控等業(yè)務指標。

其次,傳統(tǒng)企業(yè)還背負著過去十幾年、甚至二十多年逐步建設起來的信息化“包袱”,新系統(tǒng)必須與老系統(tǒng)進行對接和串聯(lián),一系列兼容之后,業(yè)務系統(tǒng)架構反而更復雜,運維壓力自然就更加沉重。

這既是傳統(tǒng)企業(yè)進行數(shù)字化轉型的痛點所在,也是云智慧智能業(yè)務運維的核心價值,即打破傳統(tǒng)運維的邊界,不再僅面對冷冰冰的IT設備,而是對實實在在的業(yè)務指標負責。

順藤摸瓜還是順瓜摸藤

如果把傳統(tǒng)IT運維的工作模式比作順藤摸瓜,那么云智慧智能業(yè)務運維的邏輯就是順瓜摸藤,二者有什么區(qū)別?

舉例說明,某大型餐飲連鎖企業(yè),會員在線交易量突降10%,這是非常典型的數(shù)字化業(yè)務場景。

如果業(yè)務下降到零,那是系統(tǒng)可用性問題,依托現(xiàn)有運維監(jiān)控系統(tǒng)能夠快速定位。但只下降10%,就很難從海量告警信息中發(fā)現(xiàn)異常,面對數(shù)十種應用系統(tǒng),數(shù)萬臺關聯(lián)IT設備,用順藤摸瓜的方式逐一排查底層設備,至少要花費一周的時間,足以造成巨大的業(yè)務損失。

對此,劉洪濤解釋了業(yè)務運維“順瓜摸藤”的操作邏輯,“首先,根據(jù)業(yè)務指標監(jiān)測可以第一時間發(fā)現(xiàn)異常。然后,通過業(yè)務邏輯拓撲快速定位與會員消費關聯(lián)的數(shù)個應用系統(tǒng)是否正常。如果正常,進一步檢測關聯(lián)的數(shù)據(jù)庫、中間件、操作系統(tǒng)的運行狀態(tài),如果上述兩層均未發(fā)現(xiàn)問題,才需檢測底層服務器、存儲、網(wǎng)絡等基礎設備。”

“順著業(yè)務到IT的這條線追蹤下來,我們只用了一個小時就追溯到故障點,一塊硬盤滿了,導致服務器響應速度變慢,造成第三方支付接口處理超時。” 劉洪濤說。由此可見,業(yè)務運維的行為邏輯已經顛覆,傳統(tǒng)運維思維是自下而上的順藤摸瓜,而業(yè)務運維思維的自上而下的順瓜摸藤。在業(yè)務運維體系中,任何影響業(yè)務指標的故障,都會變?yōu)樽罡呒墑e的服務響應事件,第一時間進行上報和處置。

以數(shù)據(jù)勾勒業(yè)務邏輯

而如何實現(xiàn)業(yè)務運維?簡單解釋,就如血液,時時刻刻向人體五臟六腑供給能量。再復雜的IT架構,再復雜的業(yè)務系統(tǒng),都是由數(shù)據(jù)組成,也是由數(shù)據(jù)進行串聯(lián)。由此,業(yè)務運維不再尋求將各系統(tǒng)進行緊密耦合,而是通過數(shù)據(jù),勾勒重現(xiàn)企業(yè)的業(yè)務邏輯。

賦能互聯(lián)網(wǎng)級運維能力 云智慧的數(shù)字化之道與術

云智慧DOCP全面接入企業(yè)IT監(jiān)控數(shù)據(jù),以及APP、瀏覽器端用戶體驗數(shù)據(jù),和業(yè)務系統(tǒng)的指標數(shù)據(jù)。這些數(shù)據(jù)既是數(shù)字化企業(yè)的核心資產,也是重現(xiàn)企業(yè)業(yè)務邏輯的基因代碼。任何影響系統(tǒng)、影響業(yè)務的蛛絲馬跡,均可通過數(shù)據(jù)分析纖毫畢現(xiàn)。

由此,云智慧可針對IT系統(tǒng)進行立體化的實時監(jiān)控,提供故障發(fā)現(xiàn)、智能告警等運維服務。進而將業(yè)務指標與IT指標進行關聯(lián),基于數(shù)據(jù)流動路徑,勾勒業(yè)務拓撲結構,提供業(yè)務效能分析等數(shù)據(jù)運營支持。

從業(yè)務運維到AIOps

其實,AI在運維領域落地有先天的優(yōu)勢。諸多流行AI場景的底層數(shù)據(jù)支離破碎,并不足以支撐上層人工智能的效果展現(xiàn),但在運維場景中,每層的數(shù)據(jù)都相當完整。“廣義來看,自動化運維也屬于AIOps范疇,但人工智能這項偉大的技術,只落地在自動化運維,未免太屈才。人工智能在業(yè)務層面幫助客戶,才是真正價值的體現(xiàn)。”劉洪濤說。

當然,也正是因為云智慧始終以業(yè)務為核心,利用AI技術率先在業(yè)務運維解決方案應用,并成功在多個行業(yè)和場景中落地,其上升空間則仍具廣闊前景。

劉洪濤說:“AIOps突破了傳統(tǒng)運維管理的權責限制。在設備層面,AIOps可通過大數(shù)據(jù)和機器學習,分析故障之間的關聯(lián)度,在關鍵故障發(fā)生前實現(xiàn)‘預警’;而在業(yè)務層面,AIOps依托業(yè)務運維平臺深挖IT指標背后的數(shù)字化業(yè)務影響,實現(xiàn)IT與業(yè)務的雙向驅動,用數(shù)字化KPI導向的智能化決策逐步取代拍腦門式的人工決策,并最終實現(xiàn)業(yè)務 ‘預測’。”

最后,劉洪濤表示,實現(xiàn)“預警”和“預測”是很多運維科技企業(yè)的理想,“而云智慧已經將這一理想落地,并首先達到可商業(yè)化程度。未來,我們的目標是通過智能運維,讓中國企業(yè)具備互聯(lián)網(wǎng)級運維和運維能力!”

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-07-12
賦能互聯(lián)網(wǎng)級運維能力 云智慧的數(shù)字化之道與術
云智慧,一家有“兩條”業(yè)務主線的企業(yè)。

長按掃碼 閱讀全文