順應新基建浪潮,看超級大行360°玩轉服務器智能運維

【導讀】隨著互聯(lián)網(wǎng)金融的快速發(fā)展,數(shù)據(jù)中心規(guī)模越來越大,設備越來越復雜,傳統(tǒng)運維模式無法滿足當前業(yè)務需求,為了解決運維困境,某超級大行引入浪潮ISPIM服務器管理平臺,ISPIM憑借資產(chǎn)信息自動錄入、監(jiān)控指標精細化管理、故障診斷專家大數(shù)據(jù)規(guī)則庫、異構設備統(tǒng)一管理等功能,幫助該行數(shù)據(jù)中心運維效率2倍提升,保障業(yè)務穩(wěn)定可靠運行。

近年來,互聯(lián)網(wǎng)金融快速崛起,傳統(tǒng)銀行不斷轉型升級,推出各類線上金融產(chǎn)品,引入智慧化設備,無紙化辦公、遠程金融交易等等,海量數(shù)據(jù)實時交易對銀行的信息系統(tǒng)也提出了更高的要求。信息技術在銀行系統(tǒng)扮演的角色越來越重要,各大銀行紛紛把構建安全、穩(wěn)定、有序、高效的IT運維管理模式,推動業(yè)務系統(tǒng)穩(wěn)定運行視作增強自身競爭能力的關鍵一環(huán)。

傳統(tǒng)運維模式跟不上業(yè)務快速發(fā)展的腳步

隨著企業(yè)業(yè)務量的不斷增長,數(shù)據(jù)中心的規(guī)模越來越大,而大規(guī)模的異構廠商設備難以進行統(tǒng)一監(jiān)控和管理,企業(yè)運維壓力不斷攀升。傳統(tǒng)運維模式嚴重依賴“人力”,運維人員即是數(shù)據(jù)中心能力的瓶頸。例如,數(shù)據(jù)中心新設備上架后的資產(chǎn)登記工作、服務器移動后的資產(chǎn)信息變更統(tǒng)計工作、年終機房設備的盤點、數(shù)據(jù)中心的報表整理等均需要以人工的方式進行維護,工作量較大、容易出錯。

而隨著銀行數(shù)據(jù)中心服務器保有量的不斷增加,設備告警泛濫、缺少融合,而且告警的設備在發(fā)生問題后,很難在第一時間得到處理。在面對故障修復問題時,傳統(tǒng)運維模式大多依賴于人的經(jīng)驗判斷,而面對大量復雜的異構設備,運維人員難免判斷失誤。

傳統(tǒng)運維與精細化管理是矛盾的,傳統(tǒng)運維模式無法單獨對服務器的功耗進行實時的監(jiān)控和統(tǒng)計,只能通過供電設備對整個機房(包含空調(diào)、照明、服務器等)耗電進行統(tǒng)計,能耗管理粒度粗。

告別傳統(tǒng)模式,浪潮ISPIM助力金融行業(yè)運維轉型

為了能夠提升服務器運維水平和運維效率,解決傳統(tǒng)運維模式當前面臨的挑戰(zhàn),某銀行巨頭近年來將“帶外管理技術研究”作為年度課題展開研究,期望通過新技術解決目前運維的痛點,保障業(yè)務運行的可靠性。

作為世界TOP級銀行,該行數(shù)據(jù)中心服務器保有量高達數(shù)萬臺,采用兩地三中心的容災方案,支撐著全國的資金管理、收費繳費、金融理財?shù)葮I(yè)務。為了滿足當前運維管理需求,解決運維困境,該行引入了浪潮ISPIM來助力運維。ISPIM(浪潮物理基礎設施管理平臺)是面向互聯(lián)網(wǎng)、金融、通信等行業(yè)數(shù)據(jù)中心的物理基礎設施自動化運維平臺,具備資產(chǎn)統(tǒng)一管理、設備實時監(jiān)控、告警精準推送、設備自動巡檢、無狀態(tài)固件管理、智能能耗分析等功能,可實現(xiàn)服務器、存儲、交換機和防火墻等設備的統(tǒng)一管理,能有效地幫助企業(yè)提高運維效率、降低運維成本,保障數(shù)據(jù)中心安全、可靠、穩(wěn)定地運行。

順應新基建浪潮,看超級大行360°玩轉服務器智能運維

圖1 ISPIM功能架構圖

創(chuàng)新運維管理平臺,看ISPIM如何乘風破浪

經(jīng)過對運維需求的考察,該行與浪潮最終決定在該行數(shù)據(jù)中心使用6臺虛擬機,以“主備HA模式”部署ISPIM。在主機宕機的情況下,可以自動切換并啟用備機,保證數(shù)據(jù)中心設備監(jiān)控的持續(xù)運行。其中,主動采集頻率為1h,監(jiān)控指標可達150W+,覆蓋了數(shù)據(jù)中心設備的所有組件。

順應新基建浪潮,看超級大行360°玩轉服務器智能運維

圖2 部署方式

浪潮ISPIM支持資產(chǎn)信息自動錄入,能夠定時批量地掃描資源,同時自動獲取設備的型號、SN序列號、BMC版本號等元數(shù)據(jù)信息,并支持導出資產(chǎn)報表。7x24小時的服務器部件級監(jiān)控告警,能夠實現(xiàn)全性能指標監(jiān)控,包括風扇、溫度、電壓等指標的監(jiān)控。通過主/被動的監(jiān)控方式,可以實時捕捉設備異常信息并及時將告警信息推送給運維人員,極大地降低了工作人員的運維壓力。

ISPIM內(nèi)置服務器專家級大數(shù)據(jù)規(guī)則庫,擁有主動巡檢機制,內(nèi)置492個故障模型、30,000+專家經(jīng)驗,可以快速診斷故障根因并關聯(lián)至對應的應急預案建議,自動提供解決方案。支持對服務器性能指標進行閾值設置,實現(xiàn)性能功耗的精準控制。功耗管理功能,用戶可以一目了然的查看不同類型服務器的能耗詳情,做到“心中有數(shù)”,為后期數(shù)據(jù)中心采購設備、擴大規(guī)模等提供參考建議。

ISPIM你值得擁有,改變數(shù)據(jù)中心運維套路

互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)乃至物聯(lián)網(wǎng)的快速興起帶動了數(shù)字技術的普及,在這一趨勢下,數(shù)據(jù)中心事實上已經(jīng)成為絕大多數(shù)公司的核心生產(chǎn)力和重要資產(chǎn)。與此同時,業(yè)務擴張與創(chuàng)新也使得數(shù)據(jù)中心的規(guī)模不斷膨脹,以BAT為例,其區(qū)域數(shù)據(jù)中心規(guī)模均已步入10萬+服務器級別。

浪潮ISPIM可同時對于數(shù)萬臺不同品牌服務器、存儲、網(wǎng)絡設備等設備的統(tǒng)一監(jiān)控、運維、告警管理,運維效率2倍提升,基于浪潮故障專家?guī)斓拇髷?shù)據(jù)規(guī)則故障診斷功能,可將故障診斷提升到93%,并且可在快速處理故障的同時最大程度降低數(shù)據(jù)泄露風險。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )