對(duì)標(biāo)數(shù)字未來(lái),智能運(yùn)維AIOps何以美好

簡(jiǎn)到極致,便是大智。簡(jiǎn)到極致,便是大美。數(shù)字化之于金融行業(yè)追求的便是一種簡(jiǎn)到極致的服務(wù)體驗(yàn),然而行業(yè)數(shù)字化程度越高,IT系統(tǒng)的復(fù)雜度和規(guī)模就越大。特別是隨著科技的進(jìn)步,區(qū)塊鏈、容器、物聯(lián)網(wǎng)等Fintech技術(shù)相繼落地,帶來(lái)更加開(kāi)放的格局。如何有效地利用ABC技術(shù)實(shí)現(xiàn)高可用、高性能和高可擴(kuò)展,并且維持信息系統(tǒng)有效、穩(wěn)定、持續(xù)地運(yùn)行?智能運(yùn)維的呼聲越來(lái)越高。

IT運(yùn)維之變, ITOM/ITSM向AIOps演進(jìn)

近年來(lái),金融行業(yè)的IT系統(tǒng)架構(gòu)逐漸從“傳統(tǒng)集中式架構(gòu)”轉(zhuǎn)向“互聯(lián)網(wǎng)架構(gòu)”,互聯(lián)網(wǎng)架構(gòu)所涉及的云化、分布式、DevOps等,使得IT運(yùn)維的壓力越來(lái)越大。隨著AI技術(shù)的商用,監(jiān)管部門(mén)鼓勵(lì)金融機(jī)構(gòu)利用智能化手段進(jìn)行業(yè)務(wù)創(chuàng)新和IT運(yùn)維管理,所以運(yùn)維體系在經(jīng)過(guò)了腳本化、工具化、自動(dòng)化之后,逐漸向智能化發(fā)展。2016年,AIOps的概念被Gartner正式提出:使用智能算法解決已知的IT問(wèn)題,并自動(dòng)化重復(fù)的工作。

經(jīng)過(guò)幾年的爭(zhēng)論和實(shí)踐,現(xiàn)在行業(yè)對(duì)AIOps基本形成共識(shí):融合大數(shù)據(jù),機(jī)器學(xué)習(xí)獲得深入的洞察力,實(shí)現(xiàn)IT運(yùn)維能力和運(yùn)營(yíng)能力的全面增強(qiáng),發(fā)掘更多運(yùn)維人員尚未覺(jué)察的潛在的系統(tǒng)故障和運(yùn)維問(wèn)題。隨著IT管理由ITIL進(jìn)化為DevOps,運(yùn)維管理平臺(tái)也從ITOM/ITSM向AIOps不斷演進(jìn)。

Gartner預(yù)測(cè),到2022年,40%的大型企業(yè)將選擇結(jié)合大數(shù)據(jù)和機(jī)器學(xué)習(xí)能力的AIOps,支持和部分替代IT監(jiān)控、服務(wù)臺(tái)和自動(dòng)化流程和任務(wù),成為IT部門(mén)提升運(yùn)維效率、降低運(yùn)維成本的重要手段。那么,AIOps如何與金融行業(yè)復(fù)雜的IT系統(tǒng)實(shí)現(xiàn)融合呢?

金融業(yè)AIOps智能運(yùn)維場(chǎng)景解析

由于金融業(yè)的IT成熟度高,數(shù)字化轉(zhuǎn)型需求迫切,有大量場(chǎng)景亟需AIOps能力。比如,海量日志數(shù)據(jù)分析、告警風(fēng)暴抑制、通過(guò)告警事件追蹤故障根因、預(yù)測(cè)業(yè)務(wù)風(fēng)險(xiǎn)等等。

云智慧CEO殷晉認(rèn)為,AIOps基于金融行業(yè)的應(yīng)用場(chǎng)景,依托大數(shù)據(jù)和人工智能技術(shù),能夠?qū)崿F(xiàn)業(yè)務(wù)指標(biāo)與IT監(jiān)控、分析、預(yù)警、處理場(chǎng)景的融合,通過(guò)關(guān)聯(lián)分析和交易鏈路追蹤,最終能夠發(fā)現(xiàn)和解決實(shí)際業(yè)務(wù)問(wèn)題。

對(duì)標(biāo)數(shù)字未來(lái),智能運(yùn)維AIOps何以美好

  云智慧智能運(yùn)維平臺(tái)

通常情況下,業(yè)務(wù)系統(tǒng)出現(xiàn)異常,最直接、最直觀反映就是關(guān)鍵業(yè)務(wù)指標(biāo)出現(xiàn)異常波動(dòng)。以云智慧某保險(xiǎn)行業(yè)頭部客戶為例,業(yè)務(wù)系統(tǒng)異常時(shí),系統(tǒng)處理保單的能力會(huì)顯著下降。

但是,如何正確判斷“保單量”出現(xiàn)下降呢?傳統(tǒng)的方式就是設(shè)置一個(gè)固定的閾值,當(dāng)實(shí)時(shí)監(jiān)控到的保單量超出上述閾值時(shí),即認(rèn)為保單量出現(xiàn)異常。傳統(tǒng)監(jiān)控系統(tǒng)的固定閾值告警,就是籍此產(chǎn)生告警信息的。

這個(gè)邏輯表面看上去沒(méi)有問(wèn)題,但是仔細(xì)想一下,每天凌晨的時(shí)候,會(huì)有多少新的保單提交到系統(tǒng)中呢(假設(shè)保險(xiǎn)公司只受理國(guó)內(nèi)的業(yè)務(wù))?顯然,每天上午10點(diǎn)到12點(diǎn)之間新提交到系統(tǒng)中的保單量要遠(yuǎn)遠(yuǎn)多于每天凌晨提交到系統(tǒng)中的保單量。以此類(lèi)推,業(yè)務(wù)系統(tǒng)在促銷(xiāo)活動(dòng)期間和平日處理的保單量也存在顯著的差別。因此,企業(yè)很難用固定閾值來(lái)判斷業(yè)務(wù)系統(tǒng)保單量指標(biāo)是否出現(xiàn)異常。

為了解決上述問(wèn)題,云智慧AIOps平臺(tái)采用多算法集成學(xué)習(xí)模式,并引入3種針對(duì)時(shí)序數(shù)據(jù)的異常檢測(cè)方法:動(dòng)態(tài)基線、同比/環(huán)比和指標(biāo)異常檢測(cè)。

動(dòng)態(tài)基線基于歷史數(shù)據(jù),利用智能算法進(jìn)行深度學(xué)習(xí),對(duì)未來(lái)一段時(shí)間內(nèi)的每個(gè)時(shí)間點(diǎn)的數(shù)值進(jìn)行預(yù)測(cè),以預(yù)測(cè)值作為基線,并通過(guò)比較實(shí)際值與基線的偏離度(百分比差異)來(lái)監(jiān)控和告警。這種方法適用于已知某數(shù)據(jù)指標(biāo)呈周期性變化且沒(méi)辦法給出每個(gè)周期的準(zhǔn)確值或者周期內(nèi)的數(shù)據(jù)變化過(guò)多的場(chǎng)景。

同/環(huán)比變化用于發(fā)現(xiàn)某個(gè)待監(jiān)測(cè)指標(biāo)的變化趨勢(shì)是持續(xù)變好還是持續(xù)變壞。將目標(biāo)監(jiān)控值與歷史同期數(shù)據(jù)的分布和同環(huán)比的變化情況進(jìn)行對(duì)比,根據(jù)數(shù)值或百分比差異情況判斷新進(jìn)數(shù)據(jù)是否異常,并作出判斷是否進(jìn)行告警。

指標(biāo)異常檢測(cè)為了應(yīng)對(duì)不對(duì)業(yè)務(wù)模式的數(shù)據(jù)差異化特點(diǎn),采用無(wú)監(jiān)督集成學(xué)習(xí)算法,無(wú)需人工設(shè)置固定閾值和定義基線偏離度,系統(tǒng)根據(jù)不同數(shù)據(jù)特點(diǎn),選擇不同算法去做針對(duì)性的檢測(cè),并對(duì)異常進(jìn)行整體評(píng)估,自動(dòng)識(shí)別不符合期望的數(shù)據(jù)后產(chǎn)生告警。

在銀行業(yè),云智慧AIOps同樣在多家商業(yè)銀行的智能業(yè)務(wù)鏈路追蹤場(chǎng)景中發(fā)揮價(jià)值。我們都知道,任何一筆金融業(yè)務(wù)的交易鏈路都可能涉及幾十個(gè)環(huán)節(jié),IT追蹤非常困難,過(guò)去都是基于垂直系統(tǒng)的監(jiān)控?cái)?shù)據(jù)由人工去做的?,F(xiàn)在,利用AIOps的實(shí)時(shí)數(shù)據(jù)分析能力,自動(dòng)對(duì)交易進(jìn)行全鏈路追蹤,對(duì)采集到的數(shù)據(jù)進(jìn)行智能關(guān)聯(lián)分析,快速得到想要的結(jié)果。

云智慧AIOps平臺(tái)以事件為核心,基于大數(shù)據(jù)技術(shù)和機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)IT全生命周期的統(tǒng)一管控。對(duì)來(lái)自于各種監(jiān)控系統(tǒng)的告警消息與業(yè)務(wù)指標(biāo)進(jìn)行統(tǒng)一的接入與處理,幫助金融企業(yè)打通數(shù)據(jù)孤島,統(tǒng)一運(yùn)維的標(biāo)準(zhǔn)與管理規(guī)范,減少對(duì)運(yùn)維的事務(wù)性干擾,實(shí)現(xiàn)事件的智能告警、異常檢測(cè)、根因分析、智能預(yù)測(cè)等。

AIOps智能運(yùn)維落地最佳實(shí)踐

2016年,云智慧在國(guó)內(nèi)率先推出了智能業(yè)務(wù)運(yùn)維解決方案,并在多個(gè)互聯(lián)網(wǎng)+轉(zhuǎn)型需求迫切的行業(yè)展開(kāi)實(shí)踐。歷經(jīng)3載,云智慧積累了豐富智能運(yùn)維最佳實(shí)踐經(jīng)驗(yàn)。殷晉在總結(jié)過(guò)往時(shí)表示,AIOps作為IT運(yùn)維發(fā)展的新階段,需要根據(jù)金融機(jī)構(gòu)的IT現(xiàn)狀和技術(shù)成熟度,采用逐步推進(jìn)、分階段實(shí)施的方式進(jìn)行落地,建議從基礎(chǔ)運(yùn)維到業(yè)務(wù)運(yùn)維,最終實(shí)現(xiàn)智能運(yùn)維。

第一階段是數(shù)據(jù)為先,無(wú)論現(xiàn)有系統(tǒng)維穩(wěn)還是業(yè)務(wù)創(chuàng)新,都需要完整數(shù)據(jù)作為基礎(chǔ)。企業(yè)完成IT系統(tǒng)建設(shè)之后,需要構(gòu)建面向全部系統(tǒng)和技術(shù)棧的統(tǒng)一監(jiān)控和運(yùn)維數(shù)據(jù)處理平臺(tái),將采集的IT數(shù)據(jù)、日志數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)等進(jìn)行實(shí)時(shí)處理和分析。

第二個(gè)階段變傳統(tǒng)被動(dòng)運(yùn)維為主動(dòng)運(yùn)維。利用大數(shù)據(jù)、人工智能和數(shù)據(jù)可視化手段,通過(guò)IT與業(yè)務(wù)指標(biāo)的融合,雙向驅(qū)動(dòng)IT管理。這個(gè)階段,既要讓業(yè)務(wù)部門(mén)能夠看懂IT,又能讓IT部門(mén)更加敏捷、主動(dòng)的支撐業(yè)務(wù)發(fā)展。

最后是智能運(yùn)維階段,該階段主要有兩個(gè)重點(diǎn):一是實(shí)時(shí)響應(yīng),當(dāng)發(fā)生問(wèn)題的時(shí)候,能夠?qū)崟r(shí)動(dòng)態(tài)響應(yīng),迅速定位問(wèn)題、解決問(wèn)題;二是預(yù)測(cè)未來(lái),結(jié)合DevOps、容器化等新一代技術(shù),做到故障治愈,這是目前智能運(yùn)維的最理想結(jié)果。

如今,基于AIOps的云智慧DOCP數(shù)字化運(yùn)維中臺(tái)已經(jīng)陸續(xù)在銀行、保險(xiǎn)、證券、基金、制造、航空等多個(gè)行業(yè)的頭部企業(yè)中得到大量應(yīng)用和認(rèn)可。

盡管AIOps在實(shí)際應(yīng)用過(guò)程中面臨著許多挑戰(zhàn),但是作為AI和大數(shù)據(jù)技術(shù)對(duì)傳統(tǒng)運(yùn)維產(chǎn)品和理念的顛覆,AIOps對(duì)標(biāo)數(shù)字未來(lái),能夠更深層次的解決數(shù)字孿生世界中的運(yùn)維管理難題,為IT管理和業(yè)務(wù)決策提供更明智的選擇,并對(duì)業(yè)務(wù)發(fā)展進(jìn)行洞察和預(yù)測(cè)。隨著時(shí)間推移,相信AIOps時(shí)代終將到來(lái)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-07-04
對(duì)標(biāo)數(shù)字未來(lái),智能運(yùn)維AIOps何以美好
簡(jiǎn)到極致,便是大智。簡(jiǎn)到極致,便是大美。數(shù)字化之于金融行業(yè)追求的便是一種簡(jiǎn)到極致的服務(wù)體驗(yàn),然而行業(yè)數(shù)字化程度越高,IT系統(tǒng)的復(fù)雜度和規(guī)模就越大。

長(zhǎng)按掃碼 閱讀全文