數(shù)智時(shí)代,數(shù)據(jù)是金融機(jī)構(gòu)經(jīng)營(yíng)的核心資產(chǎn)和最重要戰(zhàn)略資源,也是不可或缺的生產(chǎn)要素。只有更好的管理、分析業(yè)務(wù)/IT系統(tǒng)產(chǎn)生的各種數(shù)據(jù),才能從中洞察更大的業(yè)務(wù)價(jià)值,持續(xù)優(yōu)化用戶(hù)體驗(yàn),而運(yùn)維數(shù)據(jù)治理就是挖掘數(shù)據(jù)價(jià)值的基礎(chǔ)和重要手段。
亟需運(yùn)維數(shù)據(jù)治理
復(fù)雜的業(yè)務(wù)系統(tǒng),海量的IT/業(yè)務(wù)數(shù)據(jù),以及新架構(gòu)、新技術(shù)的廣泛應(yīng)用,運(yùn)維管理面臨更大挑戰(zhàn)。
第一,缺少統(tǒng)一的告警中心:各種監(jiān)控系統(tǒng)相互獨(dú)立沒(méi)有關(guān)聯(lián),告警事件內(nèi)容不同、運(yùn)維人員也不同,無(wú)法快速判斷故障根源,因多個(gè)監(jiān)控系統(tǒng)的告警事件擾亂對(duì)故障問(wèn)題的正確快速定位。
第二,缺少統(tǒng)一的監(jiān)控中心:監(jiān)控對(duì)象的邏輯拓?fù)浠蛭锢硗負(fù)錄](méi)有關(guān)聯(lián)起來(lái),當(dāng)問(wèn)題發(fā)生時(shí),需要在不同層面的監(jiān)控工具中排查,問(wèn)題的快速發(fā)現(xiàn)、快速定位、快速解決帶來(lái)了諸多不確定性,從而影響到用戶(hù)體驗(yàn)和SLA。
第三,缺少統(tǒng)一的評(píng)價(jià)體系:監(jiān)控對(duì)象都有獨(dú)立的評(píng)價(jià)標(biāo)準(zhǔn),而這些標(biāo)準(zhǔn)缺少統(tǒng)一性,導(dǎo)致運(yùn)維人員沒(méi)有指標(biāo)體系的參考依據(jù),缺少對(duì)系統(tǒng)整體運(yùn)行健康度進(jìn)行管控,同時(shí)無(wú)法制定出統(tǒng)一的故障預(yù)警管理策略。
運(yùn)維數(shù)據(jù)治理的原則
第一,統(tǒng)一數(shù)據(jù)維度:不同監(jiān)控系統(tǒng)的告警信息進(jìn)行有效的關(guān)聯(lián)、收斂、壓縮,統(tǒng)一定義告警和事件級(jí)別,以及對(duì)應(yīng)的處理(通知)流程;打通運(yùn)維工具間的數(shù)據(jù)孤島,將全部運(yùn)維監(jiān)控工具產(chǎn)生(采集)的數(shù)據(jù)進(jìn)行統(tǒng)一的處理和存儲(chǔ)。確保每個(gè)業(yè)務(wù)系統(tǒng)的每個(gè)監(jiān)控指標(biāo)都有唯一的、定義明確的數(shù)據(jù)來(lái)源。
第二,提升數(shù)據(jù)質(zhì)量:不同監(jiān)控系統(tǒng)的數(shù)據(jù)源進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)的重定義,依據(jù)國(guó)家、業(yè)界或者監(jiān)管機(jī)構(gòu)的標(biāo)準(zhǔn),再結(jié)合自身的實(shí)際情況對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理;一般包括格式、編碼規(guī)則、字典值等,將處理后的多源異構(gòu)的運(yùn)維數(shù)據(jù)進(jìn)行統(tǒng)一的存儲(chǔ)與關(guān)聯(lián)分析,從而提升運(yùn)維數(shù)據(jù)的質(zhì)量。
第三,確保數(shù)據(jù)實(shí)效性:運(yùn)維數(shù)據(jù)往往存在大量的重復(fù)和冗余,同一個(gè)事件可能導(dǎo)致大量重復(fù)的指標(biāo)、告警、日志等。通過(guò)過(guò)濾、降噪和聚合,把具備歷史分析價(jià)值的數(shù)據(jù)流轉(zhuǎn)到數(shù)據(jù)湖中進(jìn)行分析,這不僅會(huì)節(jié)省時(shí)間,而且也能夠節(jié)省冗余數(shù)據(jù)的存儲(chǔ)和計(jì)算成本。
運(yùn)維數(shù)據(jù)治理的目標(biāo)
通過(guò)建設(shè)一體化的統(tǒng)一監(jiān)控平臺(tái),可以幫助IT部門(mén)實(shí)現(xiàn)運(yùn)維數(shù)據(jù)的三個(gè)統(tǒng)一:
第一,統(tǒng)一標(biāo)準(zhǔn):實(shí)現(xiàn)運(yùn)維數(shù)據(jù)處理規(guī)范中對(duì)數(shù)據(jù)采集、處理、存儲(chǔ)、展現(xiàn)的標(biāo)準(zhǔn)統(tǒng)一;實(shí)現(xiàn)運(yùn)維事件和告警處理流程規(guī)范中對(duì)事件級(jí)別定義,處理流程定義、通知內(nèi)容定義的標(biāo)準(zhǔn)統(tǒng)一;實(shí)現(xiàn)監(jiān)控指標(biāo)定義中的SLO(服務(wù)等級(jí)目標(biāo))指標(biāo)選取。
第二,統(tǒng)一數(shù)據(jù):元數(shù)據(jù)管理可以清晰展現(xiàn)數(shù)據(jù)從哪來(lái),屬于誰(shuí),讓運(yùn)維人員或者系統(tǒng)能夠更好地理解所獲取的數(shù)據(jù),同時(shí)通過(guò)統(tǒng)一的存儲(chǔ)與關(guān)聯(lián)分析將多源異構(gòu)數(shù)據(jù)徹底打通。
第三,統(tǒng)一服務(wù):用戶(hù)通過(guò)統(tǒng)一的服務(wù)接口(GUI/API)消費(fèi)運(yùn)維數(shù)據(jù)和功能。主要包括:數(shù)據(jù)呈現(xiàn)(大屏和儀表板)服務(wù)、數(shù)據(jù)分析服務(wù)(數(shù)據(jù)建模和查詢(xún))、監(jiān)控指標(biāo)異常檢測(cè)服務(wù)、監(jiān)控告警通知訂閱服務(wù)等。
運(yùn)維數(shù)據(jù)治理解決方案
云智慧運(yùn)維數(shù)據(jù)治理解決方案支持PB級(jí)、多種數(shù)據(jù)的采集、分析、存儲(chǔ)和管理,包括海量結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),且具備線(xiàn)性的橫向擴(kuò)展能力。
運(yùn)維數(shù)據(jù)的統(tǒng)一采集
通過(guò)并行多任務(wù)采集,提高數(shù)據(jù)采集效率及準(zhǔn)確性,支持各類(lèi)數(shù)據(jù)源(日志、監(jiān)控、業(yè)務(wù)、配置等)的配置信息錄入、查看、修改,并提供各類(lèi)數(shù)據(jù)源的數(shù)據(jù)樣例展示。支持HTTP、Kafka、API、日志、文本、數(shù)據(jù)庫(kù)、自定義等多種方式數(shù)據(jù)接入,數(shù)據(jù)采集接口程序規(guī)范統(tǒng)一,同時(shí)具備監(jiān)控接口采集效率、統(tǒng)計(jì)采集數(shù)據(jù)量的能力。
運(yùn)維數(shù)據(jù)的統(tǒng)一處理
高效數(shù)據(jù)處理機(jī)制:采用高性能混合存儲(chǔ)模式,非實(shí)時(shí)數(shù)據(jù)存儲(chǔ)全量數(shù)據(jù),實(shí)時(shí)數(shù)據(jù)在全量數(shù)據(jù)的基礎(chǔ)上實(shí)現(xiàn)增量存儲(chǔ),相對(duì)于其它傳統(tǒng)的數(shù)據(jù)存儲(chǔ)查詢(xún)方式,存儲(chǔ)效率提高300倍。
可視化數(shù)據(jù)處理過(guò)程:數(shù)據(jù)處理提供圖形化操作界面,實(shí)現(xiàn)自助式數(shù)據(jù)分析與挖掘算法模型創(chuàng)建。整個(gè)數(shù)據(jù)處理過(guò)程,支持通過(guò)Web界面進(jìn)行編輯,無(wú)需編輯程序代碼或Shell腳本,即可完成數(shù)據(jù)處理的復(fù)雜操作。
數(shù)據(jù)集成與ETL:提供數(shù)據(jù)集成實(shí)施和服務(wù)功能,從ETL 數(shù)據(jù)導(dǎo)入到SQL查詢(xún)以及全文檢索的一站式圖形化工作流,支持分布式的海量日志采集、聚合和傳輸。
運(yùn)維數(shù)據(jù)的統(tǒng)一存儲(chǔ)
基于幾個(gè)核心場(chǎng)景:數(shù)據(jù)治理、數(shù)據(jù)集市、數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用等,持多種存儲(chǔ)介質(zhì)和計(jì)算模型,同時(shí)具備可靠性、可用性、一致性、伸縮性。
1、監(jiān)控?cái)?shù)據(jù)存儲(chǔ):時(shí)序數(shù)據(jù)庫(kù)(ClickHouse、InfluxDB)
2、日志數(shù)據(jù)存儲(chǔ):Elasticsearch、Hadoop/Hbase
3、分析報(bào)表數(shù)據(jù)存儲(chǔ):MySQL等關(guān)系型數(shù)據(jù)庫(kù)
4、告警事件數(shù)據(jù)存儲(chǔ):Redis數(shù)據(jù)庫(kù)
運(yùn)維數(shù)據(jù)的統(tǒng)一服務(wù)
運(yùn)維數(shù)據(jù)可以進(jìn)行按需消費(fèi),根據(jù)運(yùn)營(yíng)和運(yùn)維的需求,快速敏捷的創(chuàng)建面向特定場(chǎng)景的數(shù)據(jù)應(yīng)用,充分釋放數(shù)據(jù)的價(jià)值。匯總數(shù)據(jù)、整合指標(biāo)體系、制定相應(yīng)標(biāo)準(zhǔn),通過(guò)PC端、移動(dòng)端、ECC大屏、Dashboard,數(shù)據(jù)展示業(yè)務(wù)健康、IT資源健康、用戶(hù)體驗(yàn)、安全態(tài)勢(shì)以及問(wèn)題事件等應(yīng)用服務(wù)。
價(jià)值與展望
云智慧運(yùn)維數(shù)據(jù)治理解決方案構(gòu)建了一套完整的IT與業(yè)務(wù)系統(tǒng)的評(píng)價(jià)體系,為提高運(yùn)維效率、優(yōu)化用戶(hù)體驗(yàn)、改進(jìn)服務(wù)流程、資產(chǎn)管理、運(yùn)營(yíng)決策等方面提供了強(qiáng)有力的支撐。運(yùn)維數(shù)據(jù)治理不可一蹴而就,從業(yè)務(wù)發(fā)展、數(shù)據(jù)治理意識(shí)形成、數(shù)據(jù)治理體系運(yùn)行、人員組織等需要一個(gè)長(zhǎng)效機(jī)制來(lái)進(jìn)行保障,這樣才能讓數(shù)據(jù)資產(chǎn)可以發(fā)揮更大的作用。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )