云集技術(shù)學(xué)社 | 云運維有哪些注意事項?

9月28日,信服云托管云運維專家Jason在信服云《云集技術(shù)學(xué)社》系列直播課上進(jìn)行了《云運維概況與注意事項》的分享,詳細(xì)介紹了在云化大趨勢背景下云運維分工、職責(zé)和核心點。以下是他的分享內(nèi)容摘要,想要了解更多可以關(guān)注“深信服科技”公眾號觀看回放。

  看點一 云的演進(jìn)為運維帶來了哪些挑戰(zhàn)?

隨著信息技術(shù)的不斷發(fā)展,云演進(jìn)經(jīng)歷了硬件化、虛擬化、超融合和云四個歷程。數(shù)據(jù)中心也從傳統(tǒng)數(shù)據(jù)中心、虛擬化數(shù)據(jù)中心、軟件定義數(shù)據(jù)中心到云化數(shù)據(jù)中心。企業(yè)對信息系統(tǒng)的需求定位也在不斷變化,信息系統(tǒng)從成本驅(qū)動、成本和效率驅(qū)動、管理驅(qū)動、管理和效率驅(qū)動最后到業(yè)務(wù)創(chuàng)新驅(qū)動。

隨著企業(yè)業(yè)務(wù)規(guī)模不斷擴大,信息系統(tǒng)基礎(chǔ)架構(gòu)也從超融合、多資源池軟件定義數(shù)據(jù)中心、私有云、同架構(gòu)混合云再到現(xiàn)在的多云中臺。信息系統(tǒng)和云服務(wù)復(fù)雜化的趨勢越來越明顯,平臺的安全和運維可靠性成為了云計算的關(guān)注重點之一,對云安全和云運維的要求在不斷提高。

云集技術(shù)學(xué)社

云的演進(jìn)給運維帶來了多重挑戰(zhàn):

一是管理復(fù)雜。節(jié)點數(shù)量成千上萬,存儲、計算、網(wǎng)絡(luò)、PaaS、SaaS各種類型業(yè)務(wù)復(fù)雜。如何管理這么多的資源、平臺和業(yè)務(wù)對運維而言是一項挑戰(zhàn)。

二是自動化要求高。在如此大的業(yè)務(wù)規(guī)模和服務(wù)場景下,自動化程度是運維效率的關(guān)鍵。

三是穩(wěn)定性要求高。云作為一個服務(wù)主體,直接承載不同用戶業(yè)務(wù),對穩(wěn)定性要求極高。

四是變更頻繁。云作為客戶服務(wù)載體,需要經(jīng)常根據(jù)用戶所需開發(fā)云產(chǎn)品或新功能,由此帶來頻繁的升級事項。

五是排查問題難度增加。復(fù)雜的技術(shù)棧、復(fù)雜的業(yè)務(wù)場景,對于問題排查要求增加。

看點二 云化趨勢下運維工作如何分層?職責(zé)邊界是什么?

關(guān)于云運維,信服云對整個運維體系做了梳理,將運維分成了IDC、云平臺、云資源、應(yīng)用層四個層級,每一個層級都會有對應(yīng)的運維人員進(jìn)行維護(hù)。

應(yīng)用層包括應(yīng)用系統(tǒng)和Guest OS的運維;云資源層級運維包括日常響應(yīng)和專家服務(wù)。對于信服云而言,云資源層級是用戶服務(wù)目錄的保障。日常響應(yīng)包含了PaaS、SaaS等多項服務(wù),專家服務(wù)包含了安全服務(wù)、DBA服務(wù)、遷移服務(wù)等。

云平臺層級運維包括持續(xù)運維、IT設(shè)備安裝部署、IT設(shè)備運維三部分內(nèi)容;IDC運維主要是基礎(chǔ)設(shè)施的維護(hù),包括對供配電系統(tǒng)、空調(diào)與制冷系統(tǒng)、制冷自控系統(tǒng)、動環(huán)監(jiān)控系統(tǒng)等多方面的維護(hù),日常會對機房進(jìn)行定期巡檢。一般來說,T3及以上的機房都有非常完整的服務(wù)保障。

云集技術(shù)學(xué)社

看點三 如何擺脫“救火式運維”的困境?

業(yè)界對運維人員一直有個戲稱是“背鍋俠”,這個戲稱也反映了目前運維人員面臨的“救火式運維”困境。“救火式運維”困境即當(dāng)事件已經(jīng)發(fā)生并造成業(yè)務(wù)影響時,運維人員才能發(fā)現(xiàn)和著手處理。如何化被動為主動,突破困境?讓主動運維、持續(xù)運維成為常態(tài),就需要詳細(xì)拆解云運維核心體系,厘清運維重點,尋求技術(shù)突破,跳出運維管理怪圈。

站在管理的角度,運維的核心主要是人員、流程、技術(shù)、數(shù)據(jù)四個方面。人員是運維操作的執(zhí)行者,流程是運維操作的既定范圍與邊界,技術(shù)是運維的武器,數(shù)據(jù)能夠更好地賦能運維。

在人員層面,任何公司做好運維的第一步是擁有一個負(fù)責(zé)運維職責(zé)的團(tuán)隊。運維體系組織構(gòu)成主要有技術(shù)支持中心、專家支撐中心、平臺運維中心和職能組。以平臺運維中心為例,人員組成有IDC物理環(huán)境維護(hù)、基礎(chǔ)設(shè)施維護(hù)、網(wǎng)絡(luò)運維工程師、平臺運維工程師和工具開發(fā)組。這些人員保障著云平臺的日常運行。

在流程層面,隨著云時代場景下的系統(tǒng)規(guī)模不斷擴大、目錄日趨復(fù)雜、運維管理的無序工作狀態(tài)日益加劇,這對運維管理水平也提出了更高的挑戰(zhàn)。運維管理流程建設(shè)完備程度成為了運維效率的重要決定因素。運維流程管理設(shè)計遵循國際ITIL標(biāo)準(zhǔn),整體流程從設(shè)計、 轉(zhuǎn)換、 運營等角度出發(fā),對日常運維工作中的目錄管理、可用性管理、容量管理、變更管理等等進(jìn)行規(guī)范和定義。

在技術(shù)層面,包括CMDB、監(jiān)控指標(biāo)項及模型、告警平臺這幾類運維工具和運維自動化、持續(xù)運維等技術(shù)。他們推動著運維的發(fā)展,幫助運維人員從簡單重復(fù)的運維問題中解放出來,讓運維人員能夠更快處理重要問題。

在數(shù)據(jù)層面,數(shù)據(jù)是運維很關(guān)鍵的部分。它包含的不只是運營的工單流程或者是事件告警,還包含了知識庫、平臺所有的監(jiān)控數(shù)據(jù)。很多公司或者說很多運營人員并不是很重視數(shù)據(jù),實際上,數(shù)據(jù)在發(fā)現(xiàn)問題、解決問題和優(yōu)化方案的時候起了非常大的作用。

看點四 云運維的實際過程中有哪些注意事項?

本次直播課上,Jason根據(jù)信服云深耕云計算多年的經(jīng)驗,給出了四點建議:

(1)傳統(tǒng)運維的自動化轉(zhuǎn)型

企業(yè)數(shù)字化轉(zhuǎn)型的前提是企業(yè)需要有IT基礎(chǔ)信息化建設(shè)以及IT基礎(chǔ)信息的保障。在云化的大趨勢下,中小企業(yè)更應(yīng)該專注自身發(fā)展和數(shù)字化轉(zhuǎn)型。在運維層面,可以通過服務(wù)化采購,托管式云服務(wù)的方式將平臺運維交由云服務(wù)商來做。大型企業(yè)則應(yīng)加強投入,組建高質(zhì)量運維團(tuán)隊,建立完備流程、分工職責(zé),利用技術(shù)和工具實行主動運維,向自動化演進(jìn)。

(2)落地和執(zhí)行

在落地的執(zhí)行階段,應(yīng)以人員為根本,流程為基線,CMDB、監(jiān)控、告警為三大基石,堅定不移走自動化戰(zhàn)略。同時給予更多資源讓運維有發(fā)展的空間。

(3)數(shù)據(jù)安全

企業(yè)要敬畏生產(chǎn)環(huán)境,流程設(shè)計一定要規(guī)避低級錯誤,而且要保證數(shù)據(jù)的一致性,數(shù)據(jù)的防篡改等。

(4)擁抱風(fēng)險

任何產(chǎn)品都會存在問題,擁抱風(fēng)險。企業(yè)可以跨部門、跨體系建立一條快速解決通道以及自動化高效修復(fù)作業(yè)程序,保障運維安全。

以上就是本次直播的主要內(nèi)容,還想學(xué)習(xí)云計算的更多“門道”嗎?敬請鎖定“深信服科技”公眾號或者官網(wǎng),云集技術(shù)學(xué)社還將邀請更多的專家,分享他們對云計算技術(shù)的理解和實踐經(jīng)驗。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )