在典型的企業(yè)級數(shù)據(jù)中心部署中數(shù)據(jù)中心可能跨地域部署,并且會有不同的業(yè)務(wù)部署在跨地域的數(shù)據(jù)中心里。這就意味著網(wǎng)絡(luò)要有能力在兩個或者多個數(shù)據(jù)中心之間進(jìn)行擴(kuò)展,從而讓跨地域的業(yè)務(wù)之間可以進(jìn)行二三層通信。華云軟件定義網(wǎng)絡(luò)支持基于EVPN VxLAN 的兩個及以上數(shù)據(jù)中心的連接,簡稱DCI(Data Center Interconnect),即華云軟件定義網(wǎng)絡(luò)支持多數(shù)據(jù)中心之間以MP-BGP EVPN 作為控制平面的VxLAN Overlay網(wǎng)絡(luò)。
VxLAN 概述
顧名思義,VXLAN旨在提供與VLAN相同的以太網(wǎng)二層網(wǎng)絡(luò)服務(wù),但具有更大的擴(kuò)展性和靈活性。與VLAN相比,VXLAN具有以下優(yōu)點:
在整個數(shù)據(jù)中心靈活放置多租戶段:它提供了一種解決方案,在底層網(wǎng)絡(luò)基礎(chǔ)設(shè)施上擴(kuò)展二層網(wǎng)絡(luò)段,以便租戶工作負(fù)載可以放置在跨數(shù)據(jù)中心的物理Pod上。
可擴(kuò)展性更強,可訪問更多的二層網(wǎng)段:VLAN使用12位的VLAN ID來訪問二層網(wǎng)段,因此只能訪問4094個VLAN。VXLAN使用一個24位的段ID,稱為VXLAN網(wǎng)絡(luò)標(biāo)識符(VNID),它可以使1600萬個VXLAN段同時存在于同一個管理域中。
更好地利用底層基礎(chǔ)設(shè)施中的可用網(wǎng)絡(luò)路徑:VLAN使用生成樹協(xié)議(Spanning Tree Protocol) 預(yù)防環(huán)路,通過阻塞冗余路徑,最終網(wǎng)絡(luò)中的一半網(wǎng)絡(luò)鏈路不被有效使用。VXLAN報文在底層網(wǎng)絡(luò)中基于三層報頭進(jìn)行傳輸,可以充分利用三層路由、ECMP (equal-cost multipath)路由和鏈路聚合協(xié)議,使用所有可用路徑。
VXLAN是一種基于三層網(wǎng)絡(luò)的二層Overlay方案。它使用MAC地址封裝在UDP報文中 (MAC-in-Udp)來提供一種跨數(shù)據(jù)中心網(wǎng)絡(luò)擴(kuò)展二層網(wǎng)段的方法。VXLAN是一種在公共物理基礎(chǔ)設(shè)施上支持靈活的、大規(guī)模的多租戶環(huán)境的解決方案。物理數(shù)據(jù)中心網(wǎng)絡(luò)的傳輸協(xié)議是IP + UDP。
VXLAN 報文格式:
MP-BGP EVPN 控制平面概述
MP-BGP EVPN是基于行業(yè)標(biāo)準(zhǔn)的VxLAN控制協(xié)議。在EVPN之前,VxLAN Overlay網(wǎng)絡(luò)以flood-and-learn模式運行。在這種模式下,終端主機(jī)信息學(xué)習(xí)和VTEP發(fā)現(xiàn)都是數(shù)據(jù)平面驅(qū)動的,不需要控制協(xié)議在VTEP之間分發(fā)終端主機(jī)可達(dá)信息。MP-BGP EVPN改變了這種模式。它為遠(yuǎn)程VTEP背后的終端主機(jī)引入了控制平面學(xué)習(xí)。它實現(xiàn)了控制平面和數(shù)據(jù)平面的分離,為VxLAN Overlay網(wǎng)絡(luò)的二層轉(zhuǎn)發(fā)和三層轉(zhuǎn)發(fā)提供了統(tǒng)一的控制平面。
華云軟件定義網(wǎng)絡(luò)實現(xiàn)了MP-BGP EVPN的控制平面,提供了如下主要的優(yōu)點:
MP-BGP EVPN協(xié)議基于行業(yè)標(biāo)準(zhǔn),允許多廠商互操作。
它使控制平面學(xué)習(xí)終端主機(jī)第二層和第三層可達(dá)信息,使組織能夠建立更健壯和可擴(kuò)展的VxLAN Overlay網(wǎng)絡(luò)。
采用穩(wěn)定的MP-BGP VPN技術(shù),支持可擴(kuò)展的多租戶VxLAN Overlay網(wǎng)絡(luò)。
EVPN地址族攜帶二層和三層可達(dá)信息,從而在VxLAN Overlay網(wǎng)絡(luò)中提供完整的橋接和路由。
通過對本地VTEP進(jìn)行基于協(xié)議的主機(jī)MAC/IP路由分配和ARP (Address Resolution Protocol)抑制,最大限度地減少網(wǎng)絡(luò)泛濫。
DCI互聯(lián)
華云軟件定義網(wǎng)絡(luò)實現(xiàn)的DCI之間互聯(lián)方式有多種,根據(jù)需求的不同可構(gòu)建特定的互聯(lián)方式。
DC之間直接EBGP互聯(lián)
DC首先IBGP接入軟件網(wǎng)關(guān),軟件網(wǎng)關(guān)之間EBGP互聯(lián)
DC直接互聯(lián)
DC間直接互聯(lián)要求DC間控制器以及DC間數(shù)據(jù)通路三層互通。
當(dāng)DC間控制器直接互聯(lián)時,DC間支持豐富的功能集。其中Route Target路由條目作為MP EVPN的擴(kuò)展屬性,可以在DC間定制VPN路由,從而避免DC間巨量路由交互, 降低控制面帶寬損耗。
DC之間通過軟件網(wǎng)關(guān)互聯(lián)
華云軟件定義網(wǎng)絡(luò)軟件網(wǎng)關(guān)(華云軟件定義網(wǎng)絡(luò)GW)作為重要的輔助組件在DCI中扮演著VNI MAPPING的重要角色。SDN控制器中的路由條目通告給華云軟件定義網(wǎng)絡(luò)GW, 華云軟件定義網(wǎng)絡(luò)GW根據(jù)配置面的VNI MAPPING信息將轉(zhuǎn)換EVPN路由中的Vxlan ID,Route Target以及修改路由下一跳為華云軟件定義網(wǎng)絡(luò)GW,然后通告給遠(yuǎn)端華云軟件定義網(wǎng)絡(luò)GW。遠(yuǎn)端華云軟件定義網(wǎng)絡(luò)GW再將以上信息根據(jù)配置修改后,將路由通告在于其互聯(lián)的DC。
DC間網(wǎng)絡(luò)二層互通
DC間二層互通的場景下
各DC中需要構(gòu)建L2 BGP VPN,配置全局Route Target。
當(dāng)DC中各自的虛擬網(wǎng)絡(luò)關(guān)聯(lián)到BGP VPN上后,華云軟件定義網(wǎng)絡(luò)控制器將虛擬網(wǎng)絡(luò)路由以BGP EVPN type 2類型通告到遠(yuǎn)端DC。
Type2 路由格式:
遠(yuǎn)端DC根據(jù)路由的擴(kuò)展屬性Route Target將路由導(dǎo)入到相應(yīng)的虛擬網(wǎng)絡(luò)中,在二層表中安裝對應(yīng)路由。
華云軟件定義網(wǎng)絡(luò)控制器type2 路由
此外華云軟件定義網(wǎng)絡(luò)支持Type3 類型路由,數(shù)據(jù)面根據(jù)Type3 類型路由生成頭端復(fù)制列表。并在二層表中生成廣播列表,進(jìn)而使得當(dāng)Overlay網(wǎng)絡(luò)中存在靜默主機(jī)時,主動發(fā)送ARP請求獲取對端虛擬工作負(fù)載的ARP地址。
Type3 路由格式:
華云軟件定義網(wǎng)絡(luò)控制器上的Type3路由條目
二層通信時虛機(jī)請求同網(wǎng)絡(luò)虛機(jī)ARP地址,獲取ARP地址后,查詢二層橋接表,下一跳地址為遠(yuǎn)端DC Vtep或者如果有軟件網(wǎng)關(guān)的場景下軟件網(wǎng)關(guān)Vtep地址。 將原始報文封裝后,外層報文為udp + vxlan, vxlan id為路由通告時攜帶的Label。
內(nèi)外層報文如下圖所示:
DC間網(wǎng)絡(luò)三層互通
DC間三層通信的場景下,即為Vxlan Routing的場景。Vxlan Routing需要借助三層VNI,
三層VNI提供路由的路由實例上下文。
首先需要在各DC中創(chuàng)建Vxlan Routing路由器,將虛擬網(wǎng)絡(luò)關(guān)聯(lián)到Vxlan Routing路由器上。
再者創(chuàng)建L3 BGP VPN以及相應(yīng)的Route Target, 將Vxlan Routing路由器關(guān)聯(lián)到L3 BGP VPN上。
當(dāng)虛擬路由器關(guān)聯(lián)到L3 BGP VPN上后,虛擬網(wǎng)絡(luò)的路由會以EVPN type5路由發(fā)布,type5路由格式如下。
華云軟件定義網(wǎng)絡(luò)控制器的Type 5路由
上層為三層通信時報文封裝示例,內(nèi)層報文的DMAC為遠(yuǎn)端VTEP的MAC地址,提供路由上下文。外層VXlan頭部的VNI為三層VNI,提供三層路由上下文。當(dāng)報文到達(dá)遠(yuǎn)端DC時,根據(jù)三層VNI確認(rèn)路由的路由實例。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )