XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

隨著企業(yè)引入OpenStack平臺(tái)以后,從邊緣應(yīng)用需求逐步進(jìn)入到準(zhǔn)核心,甚至是核心業(yè)務(wù)的需求和趨勢(shì),私有云運(yùn)營團(tuán)隊(duì)常常需要面對(duì)多樣化的虛擬機(jī)遷移問題和需求(包括計(jì)劃內(nèi)和計(jì)劃外)。

例如,物理服務(wù)器進(jìn)行計(jì)劃內(nèi)的停機(jī)維護(hù),或者根據(jù)對(duì)計(jì)算和存儲(chǔ)更加細(xì)粒度的管理和規(guī)劃,需要將計(jì)算和存儲(chǔ)融合部署的架構(gòu),拆成分離部署架構(gòu),以便于未來業(yè)務(wù)的擴(kuò)展。這些都涉及到虛擬機(jī)的遷移。

根據(jù)遷移操作對(duì)業(yè)務(wù)的影響,虛擬機(jī)的遷移一般分為兩類:

1、冷遷移(Cold Migration / Non-live Migration)

虛擬機(jī)需要先停機(jī),等待與此虛擬機(jī)相關(guān)的計(jì)算和存儲(chǔ)等資源遷移完成后,再重新啟動(dòng)。在遷移期間,業(yè)務(wù)無法訪問,只有遷移完成后,業(yè)務(wù)才能恢復(fù)。由于遷移過程中涉及到存儲(chǔ)數(shù)據(jù)的拷貝,如果數(shù)據(jù)量比較大,會(huì)造成停機(jī)時(shí)間過長且不可控,因此冷遷移僅適用于對(duì)系統(tǒng)可用性要求不高的業(yè)務(wù)。

2、熱遷移(Live Migration)

虛擬機(jī)在遷移過程中保持運(yùn)行狀態(tài),業(yè)務(wù)可正常訪問,根據(jù)虛擬機(jī)的存儲(chǔ)類型又可分為:基于共享存儲(chǔ)的熱遷移、塊設(shè)備的熱遷移和基于卷的熱遷移等。 由于涉及到計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)的一體化熱遷移,對(duì)底層基礎(chǔ)設(shè)施的要求較高。

01兩種場景下的對(duì)比

我們先來對(duì)比VMware和OpenStack對(duì)虛擬機(jī)遷移的支持情況:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

從上圖可以看出,VMware歷經(jīng)了十多年的商業(yè)化發(fā)展道路,對(duì)虛擬機(jī)遷移的支持更為全面,支持計(jì)算和存儲(chǔ)的熱遷移,甚至是跨集群遷移,這通常對(duì)于目標(biāo)規(guī)劃兩地三中心業(yè)務(wù)高可用的用戶來講非常重要,但這些功能僅限于VMware場景使用,也就意味著在滿足業(yè)務(wù)高可用需求的同時(shí),選擇了相對(duì)比較單一的私有云模型,給用戶在供應(yīng)商平臺(tái)選擇上帶來局限性;

相比之下,OpenStack對(duì)虛擬機(jī)遷移功能的支持則不夠完善,對(duì)于存儲(chǔ)遷移,由于OpenStack本身開放的架構(gòu),需要依賴存儲(chǔ)廠商實(shí)現(xiàn)存儲(chǔ)層的遷移能力。

以Ceph為例,Ceph RBD作為OpenStack主流的存儲(chǔ)后端,默認(rèn)不支持在線熱遷移,RBD裸盤只能進(jìn)行離線遷移,這就意味著如果進(jìn)行跨集群遷移,虛擬機(jī)需要長時(shí)間停機(jī),整體遷移進(jìn)度受制于存儲(chǔ)的遷移進(jìn)度,如果存儲(chǔ)容量較大,更會(huì)讓整個(gè)遷移時(shí)間不可控。

如今,XSKY SDS逐步被很多用戶引入到已有的OpenStack架構(gòu)中,用于替換該私有云架構(gòu)中原有的Ceph SDS集群,這些用戶包括對(duì)于業(yè)務(wù)連續(xù)性要求非常高的省級(jí),甚至是更大規(guī)模的金融平臺(tái)。

為了幫助用戶應(yīng)對(duì)棘手的在線熱遷移問題,XSKY基于自主研發(fā)的納管卷、在線卷遷移和多集群存儲(chǔ)等特性,設(shè)計(jì)了XMotion納管熱遷移技術(shù),不但支持多家OpenStack廠商,提供面向虛擬機(jī)和租戶的存儲(chǔ)計(jì)算一體化遷移方案,更可將整體遷移效率提升10倍以上。

XSKY的納管遷移方案具有以下優(yōu)勢(shì):

? 支持存儲(chǔ)在線熱遷移,業(yè)務(wù)無需中斷,可在業(yè)務(wù)正常運(yùn)行中進(jìn)行遷移;

? 不僅支持存儲(chǔ)獨(dú)立納管遷移,也支持計(jì)算和存儲(chǔ)一體化遷移;

? 以卷為單位,上層應(yīng)用無感知,無兼容性問題;

? 支持從開源Ceph遷移到XSKY存儲(chǔ)集群,也支持從XSKY老集群遷移到新集群;

? 支持跨計(jì)算和存儲(chǔ)集群進(jìn)行遷移;

? 無廠商鎖定,支持多家OpenStack廠商;

? 強(qiáng)一致的數(shù)據(jù)完整性保證,不丟增量數(shù)據(jù);

? 支持遷移QoS,可根據(jù)業(yè)務(wù)需要自定義遷移速率,并可隨時(shí)撤銷遷移任務(wù);

? 支持以虛擬機(jī)或租戶為單位,自動(dòng)掃描關(guān)聯(lián)的存儲(chǔ),一鍵遷移;

? 結(jié)合虛機(jī)業(yè)務(wù)的完善回滾方案,應(yīng)對(duì)海量數(shù)據(jù)遷移過程中的各種硬件和網(wǎng)絡(luò)異常情況。

02存儲(chǔ)納管遷移

下面以XSKY存儲(chǔ)集群納管開源Ceph為例,介紹存儲(chǔ)納管遷移的步驟:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

1、將計(jì)算節(jié)點(diǎn)添加到XSKY存儲(chǔ)集群;

2、OpenStack Nova/Cinder等服務(wù)配置存儲(chǔ)多集群,可同時(shí)訪問開源Ceph集群和XSKY存儲(chǔ)集群;

3、在XSKY存儲(chǔ)集群創(chuàng)建納管卷,關(guān)聯(lián)該納管卷與Ceph集群中的被納管卷;

4、OpenStack Nova/Cinder等服務(wù)配置使用納管卷;

5、XSKY納管卷啟動(dòng)在線卷遷移;

6、后臺(tái)數(shù)據(jù)在線遷移完成后,XSKY納管卷會(huì)自動(dòng)合并和清理底層臨時(shí)數(shù)據(jù),完成整個(gè)遷移過程。

納管遷移中的IO訪問流程如下圖所示:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

在遷移過程中,由libvirt發(fā)起的虛擬機(jī)讀操作將由遷移網(wǎng)關(guān)從開源Ceph讀取,寫操作則由遷移網(wǎng)關(guān)進(jìn)行同步雙寫,同時(shí)寫入納管卷與被納管卷;

遷移完成后,讀寫操作將都只針對(duì)新池進(jìn)行。納管遷移網(wǎng)關(guān)對(duì)上層屏蔽遷移細(xì)節(jié),libvirt對(duì)整個(gè)遷移過程無感知,無需做任何修改。

03存算一體化在線遷移

XMotion除了提供存儲(chǔ)納管遷移以外,也支持多家OpenStack廠商之間的存儲(chǔ)和計(jì)算一體化遷移方案,以虛擬機(jī)為單位,自動(dòng)化遷移虛擬機(jī)及其存儲(chǔ)部分。

下面我們以某省級(jí)農(nóng)信社的大規(guī)模OpenStack生產(chǎn)集群遷移為案例,介紹XMotion的存儲(chǔ)和計(jì)算一體化在線遷移方案。

因?yàn)闅v史原因,過去為了規(guī)避單一供應(yīng)商的產(chǎn)品和服務(wù)風(fēng)險(xiǎn),該用戶在對(duì)外省級(jí)聯(lián)社以及對(duì)私內(nèi)部運(yùn)營,規(guī)劃和籌建了兩套OpenStack集群,這兩套集群各自獨(dú)立運(yùn)營,資源以及權(quán)限分離管理;

而在過去三年的逐步比較中,發(fā)現(xiàn)B集群服務(wù)商具有更好的產(chǎn)品穩(wěn)定性和商業(yè)服務(wù)能力,所以本次遷移的目標(biāo)是為了將OpenStack廠商A的老集群遷移到OpenStack廠商B的新集群中,同時(shí)將原XSKY存儲(chǔ)集群遷移到新版本的兩套集群中,做存儲(chǔ)災(zāi)備,因此涉及到計(jì)算和存儲(chǔ)兩個(gè)單元的同時(shí)跨集群遷移需求。

OpenStack原集群為計(jì)算和存儲(chǔ)分離部署架構(gòu),其中,計(jì)算節(jié)點(diǎn)49臺(tái)(46臺(tái)為純計(jì)算節(jié)點(diǎn),3臺(tái)計(jì)算與控制節(jié)點(diǎn)融合部署),共2886臺(tái)虛擬機(jī);存儲(chǔ)節(jié)點(diǎn)107臺(tái),采用3副本,裸容量4.38PB,有效容量1.46PB,已使用1PB,共5625個(gè)卷。

集群遷移前后的架構(gòu)如下圖所示:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

以單個(gè)虛擬機(jī)為例,XSKY的存算一體化遷移方案步驟如下:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

1、初始化

? OpenStack廠商創(chuàng)建遷移用的虛擬機(jī),進(jìn)行網(wǎng)絡(luò)和計(jì)算資源初始化等工作

? OpenStack配置多集群

2、XMotion執(zhí)行存儲(chǔ)和計(jì)算的自動(dòng)一體化遷移

? 創(chuàng)建納管卷

? 遷移虛擬機(jī)

? 納管卷重命名

? 啟動(dòng)遷移任務(wù)

本次遷移屬于計(jì)劃內(nèi)升級(jí)遷移,因此允許對(duì)虛擬機(jī)業(yè)務(wù)停機(jī),遷移耗時(shí)不超過3分鐘,主要集中于虛擬機(jī)跨計(jì)算集群的重建和啟動(dòng)階段,得益于XMotion的納管熱遷移技術(shù),整個(gè)遷移過程不受存儲(chǔ)容量的限制,新虛擬機(jī)啟動(dòng)后掛載納管卷即可對(duì)外提供服務(wù),由XSKY的遷移網(wǎng)關(guān)在后臺(tái)執(zhí)行數(shù)據(jù)熱遷移,業(yè)務(wù)在存儲(chǔ)遷移過程中不受遷移進(jìn)度影響,可正常訪問。

遷移完成后,在OpenStack控制面板可觀察到新虛擬機(jī)已正常運(yùn)行:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

而在XSKY存儲(chǔ)控制面板則可觀察到存儲(chǔ)卷為在線遷移狀態(tài):

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

XSKY支持針對(duì)在線遷移中的卷執(zhí)行速率調(diào)整和取消遷移任務(wù)等操作:

? 調(diào)整遷移速率,支持高、中、低三檔遷移速率,如果擔(dān)心遷移速率過大影響正常業(yè)務(wù),則可將遷移速率調(diào)小;

? 取消遷移任務(wù),如果遷移導(dǎo)致業(yè)務(wù)速率降低,則可以取消遷移任務(wù),釋放帶寬來滿足前端業(yè)務(wù)需求,后續(xù)再重新開啟遷移任務(wù)。

本次遷移實(shí)測(cè)的不同檔次遷移速率如下:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

XMotion遷移不僅可以支持跨OpenStack廠商和存儲(chǔ)遷移,方便后期業(yè)務(wù)擴(kuò)展,而且可以獲得新版本XSKY存儲(chǔ)集群的所有特性,遷移完成后的虛擬機(jī)性能也獲得同步提升:

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

04更多適用場景

除了以上提到的場景外,XMotion納管熱遷移技術(shù)還可靈活應(yīng)用于多種業(yè)務(wù)場景。

1、遷移開源Ceph或老版本XSKY存儲(chǔ)

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

遷移需求:

? 開源Ceph運(yùn)維難度大, 將開源Ceph遷移到XSKY存儲(chǔ)上,獲得專業(yè)和易用的企業(yè)級(jí)存儲(chǔ)能力;

? 部署了新版本XSKY存儲(chǔ)集群,希望將老集群遷移到新集群,釋放老集群資源。

方案優(yōu)勢(shì):

? 保留OpenStack計(jì)算集群,遷移底層Ceph或XSKY老集群到XSKY新集群;

? 以虛擬機(jī)和租戶為單位,面向業(yè)務(wù)遷移;

? 在線遷移,業(yè)務(wù)無感知;

? 自動(dòng)化遷移,運(yùn)維成本低。

2、跨集群遷移計(jì)算和存儲(chǔ)集群

XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍

遷移需求:

? 計(jì)算集群升級(jí);

? 存算分離;

? 跨集群遷移虛擬機(jī);

? OpenStack集群跨地域遷移;

? 不同OpenStack廠商集群切換;

? 要求遷移時(shí)間可控,遷移過程業(yè)務(wù)不中斷。

方案優(yōu)勢(shì):

? 計(jì)算和存儲(chǔ)同時(shí)遷移;

? 支持跨計(jì)算集群和跨存儲(chǔ)集群遷移;

? 遷移時(shí)間可控,不受存儲(chǔ)容量限制;

? 多OpenStack廠商支持;

? 自動(dòng)化遷移,運(yùn)維成本低。

05小結(jié)

OpenStack進(jìn)入我們的視線已經(jīng)有很多年了,開源且具有開放性的OpenStack平臺(tái)對(duì)于許多植根互聯(lián)網(wǎng)基因的企業(yè)來說具有強(qiáng)大的吸引力,但由于產(chǎn)品化程度不足,運(yùn)維和開發(fā)投入的人力和資金往往不可忽視。

而最終在很多需要跨集群滿足業(yè)務(wù)連續(xù)性的場景,無法攻城略地的原因,則來自于OpenStack場景下,天然短板的熱遷移(Live-Migration)能力。XSKY XMotion納管熱遷移技術(shù),讓OpenStack也能夠支持熱遷移,極大提升虛擬機(jī)遷移效率。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-05-28
XSKY發(fā)布XMotion納管熱遷移技術(shù),OpenStack集群遷移效率提升超10倍
隨著企業(yè)引入OpenStack平臺(tái)以后,從邊緣應(yīng)用需求逐步進(jìn)入到準(zhǔn)核心,甚至是核心業(yè)務(wù)的需求和趨勢(shì),私有云運(yùn)營團(tuán)隊(duì)常常需要面對(duì)多樣化的虛擬機(jī)遷移問題和需求(包括

長按掃碼 閱讀全文