智匯華云 | Kubernetes多集群管理方案kubefed原理解析

智匯華云

Kubernetes 原生的管理能力目前仍然停留在單集群級別。每一個集群可以穩(wěn)定地自治運行,但是卻缺乏橫貫多個集群的統(tǒng)籌管理能力。Kubefed是開源的多集群管理方案,可應用于突破單集群性能瓶頸、異地多集群、混合云管理等場景。通過CRD+Operator的方式定義一系列自定義聯(lián)邦資源,并通過自定義Controller實現(xiàn)跨集群資源協(xié)調(diào)能力。

kubefed簡介

1.1 kubfed介紹

Kubefed(Federation v2)即 Kubernetes 聯(lián)邦,是開源的多集群解決方案,目前的版本是 v0.8.1,處于beta階段。Federation v1版本因為在擴展性、權(quán)限管理、架構(gòu)等方便存在一定缺陷而被廢棄。v2版本對v1版本架構(gòu)進行了優(yōu)化,使用CRD+operator的方式定義一系列自定義聯(lián)邦資源,并通過自定義controller實現(xiàn)跨集群資源協(xié)調(diào)能力。

Kubefed可應用于突破單集群性能瓶頸、控制故障爆炸半徑、異地多集群、混合云管理等場景,集群建立聯(lián)邦后,可以將用戶的k8s資源在多集群中分發(fā)并管理。

1.2 Kubfed組成

 智匯華云

Kubefed組件圖

Kubefed所有組件部署在一個集群中,該集群作為Host集群,kubefed通過api訪問其他成員集群的kube-apiserver實現(xiàn)對成員集群的管理,kubefed所在集群也可以配置為成員集群。

Kubefed主要由三個組件組成:

Kubefed admission webhook:提供了準入控制,作用在CR的創(chuàng)建過程的校驗階段

Kubefed controller-manager:kubefed控制平面,處理自定義資源以及協(xié)調(diào)不同集群間的資源狀態(tài)

Kubfedctl:二進制管理工具,實現(xiàn)用戶和kubefed的交互,比如集群注冊、資源注冊等

2 kubefed CRD

2.1 Kubefed CRD介紹

Kubefed通過crd實現(xiàn)了對任意資源的聯(lián)邦管理,相對于Federation v1需要通過擴展api-server的實現(xiàn),大大提高了靈活性和擴展性。

Kubefed中CRD API GROUP如下表格所示:

智匯華云

2.2 kubefed CRD的交互

智匯華云

CRD組成及交互圖

對集群資源聯(lián)邦化的實現(xiàn)主要是通過兩種CRD來完成,分別是 FederatedTypeConfig 和 Federated。

FederatedTypeConfig定義了 Federated和kubernetes api資源的關(guān)聯(lián)關(guān)系。而 Federated用來定義怎么去聯(lián)邦化對應的kubernetes api資源。

一個典型的deployment的FederatedTypeConfig示例如下:

apiVersion: types.kubefed.io/v1beta1

kind:FederatedDeployment

metadata:

name: fed-deploy

namespace: fed-ns

spec:

template:

{deployment-define}

overrides:

- clusterName: cluster-1

clusterOverrides:

- path: /spec/replicas

value: 10

- path: /spec/template/spec/containers/0/image

value: nginx:1.17.0-alpine

placement:

clusters:

- name: cluster-1

- name: cluster-2

status:

clusters:

- name: cluster -1

- name: cluster -2

conditions:

- lastTransitionTime: "2021-12-13T09:40:27Z"

status: "True"

type: Propagation

Federated Type CRD包含三個部分:

Template:該資源本身的定義,用于集群中該資源的創(chuàng)建

Placement:分發(fā)策略,定義該資源部署于哪些集群中

Overrides:對template中的字段進行覆蓋重寫,用于對資源的配置更新。如示例中對名稱為cluster-1的member cluster中deployment的副本數(shù)和鏡像進行了重新配置。Override中未選擇的集群使用template的定義,保持不變。

用戶通過kubefedctl enable命令生成指定該資源類型的FederatedTypeConfig CRD,通過 kubefedctl federate或者使用定義好的yaml文件對資源進行聯(lián)邦部署。

2.3 集群資源調(diào)度CRD

RSP(ReplicaSchedulingPreference)可以被視為對用戶更友好的分發(fā)副本的機制,方便用戶定義資源在不同集群的部署策略。用戶只需要創(chuàng)建RSP資源和關(guān)聯(lián)的聯(lián)合資源(僅填充spec.template)可以將副本在各集群之前按照定義策略分發(fā)。

RSP模塊可以對Federated Type CRD中placement和Overrides字段內(nèi)容進行重寫,rs重寫數(shù)據(jù)來源于用戶配置的調(diào)度文件。

一個典型的RSP文件定義示例如下,該RSP文件定義了一個deployment應用負載在部署時,各集群的部署策略。

apiVersion: scheduling.kubefed.io/v1alpha1

kind:ReplicaSchedulingPreference

metadata:

name: fed-deploy

namespace: fed-ns

spec:

targetKind: FederatedDeployment

totalReplicas: 20

clusters:

"*":

weight: 1

maxReplicas: 15

cluster-1:

weight:

minReplicas: 3

maxReplicas: 10

RSP文件中主要包含以下字段:

targetKind:定義該RSP文件應用的聯(lián)邦資源類型,目前僅支持FederatedDeployment和FederatedReplicaSet。

totalReplicas:資源的總副本數(shù),各個集群按照用戶配置的權(quán)重或者比例進行資源計算時,會先根據(jù)總數(shù)進行計算得到一個初步結(jié)果,若集群中配置了最大值或最小值與計算得到的值沖突,則會使用用戶配置的最大值或者最小值。因此實際的總副本數(shù)可能會和配置的總副本數(shù)不一致。

2.3 kubefed 實現(xiàn)原理

kubefed使用自定義CRD和自定義controller 實現(xiàn)聯(lián)邦集群的資源管理,原理如下圖所示:

智匯華云

Kubfed控制面主要由三個自定義controller組成:

ClusterController: 集群控制器,用戶通過kubefedctl join/unjoin 來加入/刪除集群,當成功加入時,會建立一個 KubefedCluster 組件來儲存集群相關(guān)信息,如 API Endpoint、CA Bundle 等。這些信息會被用在 KubeFed Controller 訪問各 Kubernetes 集群,以確保能夠建立 Kubernetes API 資源。并定時調(diào)用各集群的/healthz接口,維護可用集群列表,用于應用分發(fā)前的集群選擇與過濾。

FederateTypeConfigController:聯(lián)邦資源控制器,用于管理各集群間資源分發(fā)與狀態(tài)監(jiān)控。聯(lián)邦資源控制器會為每種聯(lián)邦資源類型創(chuàng)建一個資源分發(fā)控制器,和狀態(tài)收集控制器,實現(xiàn)該類資源的聯(lián)邦功能。StatusController和SyncController 都使用了FederatedInformer用來感知所有member cluster中某中聯(lián)邦資源的變更。如果變更則從HostCluster中獲取最新的資源定義同步到各memberCluster中。

SchedulerManage:調(diào)度控制器,用于創(chuàng)建適用于ReplicaSet和Deployment的RSPController,RSPController。當用戶創(chuàng)建RSP資源后,RSP Controller 會收到通知,匹配對應 namespace/name 的 FederatedDeployment 與 FederatedReplicaSet 是否存在,若存在的話,會根據(jù)rsp中設(shè)定的策略計算出每個集群預期的副本數(shù),之后覆寫 Federated 資源中的 spec.overrides 內(nèi)容以重新定義每個集群的副本數(shù),最后再由 KubeFed Sync Controller 來同步至每個集群。

3 總結(jié)

Kubefed通過crd與自定義controller實現(xiàn)了對任意資源的聯(lián)邦,并支持用戶自定義調(diào)度策略,易于擴展和維護。

目前多集群管理除了kubefed項目還有華為推出的karmada、阿里和redhat推出的OCM(open cluster management)項目,相對于karmada部署資源時host cluster上必須要部署,kubefed可以選擇不部署在host cluster,減少了控制面所在集群的負擔,但在資源管理和資源調(diào)度上karmada比kubefed有優(yōu)勢。另外kubefed相對于ocm,聯(lián)邦化資源會產(chǎn)生較多的crd,在維護各集群中crd的api版本增加了負擔。因此需要用戶根據(jù)實際使用場景選擇合適的多集群管理方案。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )