運(yùn)維工程師說(shuō)要有光,于是便有了它

原標(biāo)題:運(yùn)維工程師說(shuō)要有光,于是便有了它

云計(jì)算歷經(jīng)多年發(fā)展,從最初的概念模型,到被大眾熟知,再到現(xiàn)在全行業(yè)擁抱上云,取得巨大進(jìn)步。云的主要客戶已從最初的中小初創(chuàng)公司逐步滲透到各行各業(yè)的大型企業(yè)。可以說(shuō),企業(yè)上云已是企業(yè)發(fā)展的必由之路。部分?jǐn)?shù)據(jù)敏感的企業(yè)結(jié)合自身數(shù)據(jù)的安全性、所有權(quán)和控制權(quán)等綜合因素考慮,會(huì)選擇搭建自己的私有云或者混合云環(huán)境。

但是在上述環(huán)境中,用戶的機(jī)器都需要自行管理,這就必然給云運(yùn)維人員帶來(lái)很多意想不到的麻煩。

其實(shí)我們面臨的問(wèn)題從來(lái)就沒(méi)有什么大的變化,唯一不同的只是機(jī)器規(guī)模越來(lái)越大,人心越來(lái)越復(fù)雜。

Q:如何在1臺(tái)機(jī)器上部署基礎(chǔ)設(shè)施?

A:

一切都源于那個(gè)亙古不變的道理:扔一個(gè)文件到機(jī)器上,然后跑一個(gè)命令。

Q:如何在10臺(tái)機(jī)器上部署基礎(chǔ)設(shè)施?

A:

寫(xiě)個(gè)for循環(huán)搞定。

Q:如何在1000臺(tái)機(jī)器上部署基礎(chǔ)設(shè)施?

A:

這個(gè)也好辦!定制操作系統(tǒng)鏡像CUSTOM.iso裝機(jī)自動(dòng)化安裝!

then……

Q:如何快速升級(jí)所有機(jī)器上的基礎(chǔ)設(shè)施?

Q:服務(wù)因異常掛掉,能自動(dòng)重啟?;顔??

Q:公司做活動(dòng),預(yù)計(jì)流量突增,能擴(kuò)容嗎?

Q:公司活動(dòng)結(jié)束,為節(jié)約成本,能縮容嗎?

Q:新開(kāi)發(fā)的基礎(chǔ)設(shè)施服務(wù)有問(wèn)題,能立馬回滾嗎?

Q:可以做虛擬化資源限制基礎(chǔ)設(shè)施不占用過(guò)多的機(jī)器資源嗎?

Q:如何先部署小批量機(jī)器,確認(rèn)無(wú)誤之后,再做全集群部署?簡(jiǎn)而言之,灰度發(fā)布。

Q:新到位10000機(jī)器,如何高效部署最新的基礎(chǔ)設(shè)施?使集群中所有機(jī)器環(huán)境同質(zhì)化?

管中窺豹,我們可以發(fā)現(xiàn)如果在私有云或者混合云場(chǎng)景中還是通過(guò)人肉運(yùn)維的方式管理,那么管理效率將會(huì)十分低下,并且其中重復(fù)繁雜的操作,難以保證云環(huán)境的穩(wěn)定性和安全性。

急人之所急,需人之所需。百度云的工程師們便展開(kāi)了一場(chǎng)頭腦風(fēng)暴......

原始太初

私有云中存在大規(guī)模的機(jī)器集群,集群中一片空虛混沌,淵面黑暗,僅有字節(jié)流在其間穿梭。為有效地管控體量龐大的集群,合理分配資源,降低運(yùn)維成本,保障云上服務(wù)穿越狂風(fēng)暴雨,工程師們意識(shí)到:“必須要有一個(gè)優(yōu)秀系統(tǒng)來(lái)管控這混沌的集群世界!”

第一天

工程師們說(shuō):“這個(gè)系統(tǒng)要代表操作系統(tǒng)的意志!占用資源少!對(duì)外部系統(tǒng)零依賴!裝機(jī)自帶!要能自升級(jí)和自?;?!”。當(dāng)裸機(jī)啟動(dòng)之后,這個(gè)系統(tǒng)便以root身份運(yùn)行,能?;钭约?,還能托管維護(hù)其余基礎(chǔ)設(shè)施,后續(xù)迭代升級(jí)也能自動(dòng)完成,整個(gè)流程高度自動(dòng)化,不需要人工介入,極大地降低運(yùn)維成本。

第二天

工程師們說(shuō):“這個(gè)系統(tǒng)必須運(yùn)行穩(wěn)定,性能卓越,支持跨平臺(tái)(Linux、Windows、ARM)安裝,要做到同時(shí)管理上萬(wàn)臺(tái)服務(wù)器,一點(diǎn)兒都不慌?!?/p>

第三天

工程師們說(shuō):“這個(gè)系統(tǒng)不能像瑞士軍刀,而應(yīng)該重劍無(wú)鋒、大巧不工,僅支持基礎(chǔ)設(shè)施的維護(hù)管理,要能做到快速擴(kuò)縮容!出現(xiàn)問(wèn)題能立刻回滾,保障云環(huán)境的安全和穩(wěn)定?!?/p>

第四天

工程師們說(shuō):“這個(gè)系統(tǒng)還要做到‘麻雀雖小,五臟俱全’!要為基礎(chǔ)設(shè)施提供虛擬化容器隔離,應(yīng)用部署,應(yīng)用拓?fù)浯罱ê图嚎刂频墓δ?。為?yīng)用的整個(gè)生命周期保駕護(hù)航,提供一條龍服務(wù)?!?/p>

總之就是四個(gè)字,“輕”、“穩(wěn)”、“?!?、“全”,對(duì)于這一切,工程師們很滿意。

于是百度云的工程師們結(jié)合百度歷年來(lái)云計(jì)算的經(jīng)驗(yàn)與技術(shù)沉淀,潛心打磨,匠心打造,最終強(qiáng)勢(shì)推出新一代私有云云基礎(chǔ)設(shè)施管理引擎HALO。

Q:HALO是什么?

A:HALO全稱

Hybrid-cloud Application Layout and Operation system。

顧名思義,它是私有云或混合云環(huán)境中的基礎(chǔ)設(shè)施部署和集群控制系統(tǒng),是混亂集群中的第一束光,讓無(wú)序的集群世界變得有序可控,是云最底層的基石,肩負(fù)著裸機(jī)環(huán)境配置,root域權(quán)限控制和智能托管基礎(chǔ)設(shè)施的重任。如果沒(méi)有HALO,集群機(jī)器將處于失控的狀態(tài)。它屏蔽了云服務(wù)底層繁雜的管控邏輯,提供簡(jiǎn)化接口給上層系統(tǒng)NoahEE調(diào)用,使上層系統(tǒng)更好更快地釋放價(jià)值。

Q:這么優(yōu)秀的系統(tǒng)到底是如何實(shí)現(xiàn)的呢?

A:一圖勝千言,HALO的架構(gòu)簡(jiǎn)圖如下所示。

HALO系統(tǒng)采用主從架構(gòu),分為Master端和Agent端。

  • Master端主要做復(fù)雜的任務(wù)調(diào)度和管控邏輯,并且所有功能都是模塊化設(shè)計(jì),用戶可以根據(jù)自己的需求定制安裝,包括虛擬化容器管理,應(yīng)用包管理、部署、擴(kuò)縮容、拓?fù)浯罱ê捅;?,集群控制等?/li>
  • Agent端則以簡(jiǎn)單為原則,弱化繁瑣功能,僅作為任務(wù)的執(zhí)行器,其中的supervisor組件,結(jié)合父子雙進(jìn)程原理,做到自升級(jí)和自保活,把云運(yùn)維人員的工作量降到最低。

整個(gè)系統(tǒng)的工作流程也十分簡(jiǎn)潔優(yōu)雅!Agent通過(guò)定期心跳的方式,與Master進(jìn)行通信,在心跳發(fā)包中發(fā)送本機(jī)狀態(tài)信息,在心跳回包中獲取Master期望的本機(jī)狀態(tài)plan,并把期望plan與本地實(shí)際plan進(jìn)行對(duì)比,針對(duì)有差異的地方做相應(yīng)修改,使二者保持一致,從而保證集群中所有機(jī)器最終狀態(tài)一致。

總之一句話,一朝HALO在手,從此不用發(fā)愁。所有運(yùn)維需求,直接調(diào)用接口。

結(jié) 語(yǔ)

為了防止大規(guī)模集群被破壞,為了保護(hù)集群世界的安全,貫徹高效和簡(jiǎn)單的運(yùn)維理念,這就是我們新一代的基礎(chǔ)設(shè)施管理引擎HALO。

親愛(ài)的讀者如果你看到這,恭喜你在有意義的事上花費(fèi)不止1分鐘。來(lái)都來(lái)了,不妨看個(gè)硬廣再走~

在全行業(yè)擁抱上云的大背景下,如果你的企業(yè)在各類云場(chǎng)景中存在痛點(diǎn)或困境,歡迎

關(guān)注百度云微信公眾號(hào),了解和聯(lián)系試用我們的智能運(yùn)維產(chǎn)品,其中除了有重磅企業(yè)級(jí)運(yùn)維平臺(tái)NoahEE,更有我們?cè)谥悄苓\(yùn)維領(lǐng)域的實(shí)踐和探索!

最后的最后,如果本文能讓你快樂(lè)1秒,請(qǐng)?jiān)u論、點(diǎn)贊、收藏、轉(zhuǎn)發(fā)!祝全家不脫發(fā)!

如果沒(méi)看過(guò)癮,記得關(guān)注百度云微信公眾號(hào)哈

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-03-01
運(yùn)維工程師說(shuō)要有光,于是便有了它
。當(dāng)裸機(jī)啟動(dòng)之后,這個(gè)系統(tǒng)便以root身份運(yùn)行,能?;钭约?,還能托管維護(hù)其余基礎(chǔ)設(shè)施,后續(xù)迭代升級(jí)也能自動(dòng)完成,整個(gè)流程高度自動(dòng)化,不需要人工介入,極大地降低運(yùn)維成本。

長(zhǎng)按掃碼 閱讀全文