打造無中心架構的大數(shù)據平臺!柏睿數(shù)據 Rapids Lizard“扁平化管理”的成功實踐

導語

為從海量數(shù)據中高效、實時、安全、簡便地挖掘價值,柏睿數(shù)據推出一站式大數(shù)據平臺Rapids Lizard,采用無中心架構,實現(xiàn)數(shù)據庫的高可擴展性、高可靠性、高安全性和易運維,能夠更好地支持海量數(shù)據處理和分析,助力企業(yè)加速實現(xiàn)數(shù)字化運營,驅動業(yè)務增長和創(chuàng)新。

從單機、集群架構到無中心架構

大數(shù)據時代,為滿足不斷增長的數(shù)據規(guī)模和并發(fā)訪問需求,數(shù)據庫經歷了從單機架構到集群架構、分布式架構的演進,以提高數(shù)據庫的可用性、可擴展性和處理分析性能。其中分布式架構又分為主從架構、多主架構和分布式無中心架構等常見類型。

我們可以通過“開飯館”的故事簡單直觀地了解這幾種分布式架構的特點。

假設我們創(chuàng)業(yè)開了一家小飯館,經過辛勤經營,飯店的生意越來越好,單靠我們自己已經很難兼顧后廚管理了,于是提拔了一位老員工擔任廚師長,來專門管理后廚各個廚師。此時廚師長相當于主節(jié)點,其他廚師相當于從節(jié)點;主節(jié)點負責協(xié)調所有從節(jié)點的工作,而從節(jié)點則負責執(zhí)行具體的任務,此時整個后廚構成了主從架構;這種架構簡單易于實現(xiàn),但存在單點故障問題;如果主廚請假了,整個廚房可能無法正常運行。

后來,我們的業(yè)務越做越大,后廚設立了兩個出餐組,并在兩個區(qū)域各任命一個主廚來分別管理各自區(qū)域;兩位主廚之間協(xié)調合作,確保整個廚房順利運作。此時,兩位主廚相當于多個主節(jié)點,它們協(xié)調所有從節(jié)點的工作,整個后廚構成多主架構。這種架構可以實現(xiàn)更高的容錯性,但可能出現(xiàn)數(shù)據不一致或不完整的情況。

還有一種便是完全無中心架構。假如我們沒有在兩個出餐組內分別任命主廚,因此廚師們之間沒有固定的主從關系,而是通過協(xié)商來決定由誰負責制作哪道菜。此時,每個出餐組相當于一個節(jié)點,整個后廚相當于一個分布式無中心系統(tǒng);每個節(jié)點都獨立運作,負責處理分配給它的請求。這種架構在后廚中運用看起來會面臨分工不明確、缺乏管理等問題,但作為數(shù)據庫的技術架構,它較其他架構有著無可比擬的優(yōu)勢。

如上圖,具體而言,在無中心架構下,整個數(shù)據庫系統(tǒng)沒有一個中心節(jié)點,集群中每個節(jié)點都是平等的,每個節(jié)點都可以向其他節(jié)點發(fā)送或接收信息,獨立處理和存儲數(shù)據,并通過節(jié)點之間的協(xié)調和通信完成整個系統(tǒng)的任務。該架構系統(tǒng)具備高可擴展性、可靠性、安全性和易運維,避免傳統(tǒng)的單點故障問題,這也是柏睿數(shù)據大數(shù)據平臺Rapids Lizard采用無中心分布式架構的重要原因。

柏睿數(shù)據大數(shù)據平臺Rapids Lizard是集成數(shù)據采集、存儲、計算分析、治理與可視化的實時大數(shù)據平臺與解決方案,擁有開源架構數(shù)十倍的性能優(yōu)勢,基于低代碼、全流程、模塊化的方式,為企業(yè)提供一站式數(shù)據資產管理和大數(shù)據智能應用與服務。

為打造平臺化一體化產品,集成數(shù)據存儲平臺、數(shù)據計算平臺、數(shù)據應用平臺等子平臺,以及子平臺內部的多個功能項,柏睿數(shù)據Rapids Lizard采用無中心分布式架構構建湖倉一體化解決方案,支撐大規(guī)模數(shù)據存儲,解決數(shù)據表的分布式讀寫存放,滿足高并發(fā)、大規(guī)模的計算查詢等大數(shù)據應用場景需求。

二、Rapids Lizard無中心架構優(yōu)勢

柏睿數(shù)據大數(shù)據平臺Rapids Lizard采用無中心架構,具備以下核心優(yōu)勢:

高可擴展性:根據實際需求支持集群動態(tài)擴容縮容,集群擴展幾乎是無限制的。同時整體集群可達到查詢性能高于開源Spark數(shù)十倍。

高可靠性:使用分區(qū)鍵進行Hash分區(qū)實現(xiàn)數(shù)據在不同數(shù)據節(jié)點中的均衡負載,當某個節(jié)點發(fā)生故障時,其他節(jié)點仍然工作,從而保證了系統(tǒng)的可靠性;同時多節(jié)點數(shù)據備份不會導致整個系統(tǒng)的數(shù)據丟失或不可用。

高安全性:每個節(jié)點都具有相同的權限和責任,因此不存在單點故障和單點攻擊的問題。分布式散列算法分配數(shù)據和任務,保證數(shù)據的最終一致性、安全性和完整性。

易于維護和升級:集群角色統(tǒng)一化,用戶能夠單獨對每個節(jié)點進行維護和升級,過程不會影響整個系統(tǒng)的運行,大大降低維護者運維的復雜性。同時,通過自動化部署和管理,減少了人力和物力成本。

三、Rapids Lizard無中心架構原理與實踐

柏睿大數(shù)據平臺 Rapids Lizard 以松耦合多層級架構,其主要核心模塊由數(shù)據存儲、數(shù)據計算分析和任務調度系統(tǒng)組成,下面將逐步介紹Rapids Lizard在這三大核心模塊中如何實現(xiàn)統(tǒng)一的無中心架構。

1、數(shù)據存儲

Rapids Lizard 基于分布式、無中心架構設計的柏睿存儲管理系統(tǒng)Rapids Store作為底座,滿足支持海量存儲容量管理,為用戶提供高性能的穩(wěn)定網絡存儲。

存儲客戶端能夠同時從所有存儲節(jié)點讀寫數(shù)據,大大提升了數(shù)據讀寫速度與可用性。

多副本技術保障數(shù)據文件的可靠性。Rapids Store將每份數(shù)據分成多份,每份數(shù)據同時寫入多個主機的不同磁盤中,當某個磁盤或主機出現(xiàn)故障時,存儲客戶端還能從其他副本中正常讀寫數(shù)據。

支持故障域自治,自動遷移故障數(shù)據、恢復平衡數(shù)據。

Rapids Store為虛擬機提供磁盤快照功能,通過快照方式快速保存虛擬機磁盤中的重要文件、程序配置信息等。

內部集成KVE虛擬化計算和RapidStore功能。集群的物理節(jié)點可以同時用于計算(運行虛擬機和容器)和多副本存儲;因此傳統(tǒng)的計算資源和存儲資源管理功能可以由統(tǒng)一的超融合應用實現(xiàn),無需再部署專用存儲網絡設備(SANs)和網絡存儲設備(NAS)。

2、數(shù)據計算分析

Rapids Lizard 基于柏睿數(shù)據全內存分布式數(shù)據庫RapidsDB作為計算分析引擎,滿足PB級別數(shù)據存儲和在線實時分析;采用分布式計算與存儲分離架構,支持集群動態(tài)擴容縮容。

其基本原理包括:

數(shù)據分片:將整個數(shù)據集按照某種規(guī)則劃分成多個片段,然后將這些片段存儲在不同的節(jié)點上;能夠解決單一節(jié)點存儲數(shù)據量過大,導致性能下降和可擴展性受限的問題。

數(shù)據復制:為了保證數(shù)據的可靠性和容錯性,RapidsDB支持內部HA模式,即數(shù)據會復制到多個節(jié)點上。主要支持成對模式和負載均衡模式。

數(shù)據一致性:RapidsDB基于CAP原理滿足數(shù)據最終一致性。對于在內存中的數(shù)據,支持以事務日志和快照的方式,保障數(shù)據一致性。

負載均衡:為避免節(jié)點之間出現(xiàn)負載不均衡的情況,RapidsDB采用基于算法的負載均衡策略進行資源和任務的調度。

分布式計算:把需要進行大量計算的工程數(shù)據劃分為多個小任務,由各個數(shù)據節(jié)點進行獨立計算處理,各個節(jié)點基于通訊協(xié)議保障任務正確執(zhí)行和結果正確,并合并得到最終結果。Rapids Lizard作為開放性大數(shù)據平臺,除了自研計算引擎RapidsDB外,兼容Spark、Flink等分布式計算引擎。

故障恢復:RapidsDB支持主備集群切換、集群內HA數(shù)據復制、數(shù)據備份恢復等策略,應對節(jié)點之間通信和協(xié)調出現(xiàn)延遲、丟包及節(jié)點本身故障等問題。

安全機制:RapidsDB支持常見的安全措施,包括數(shù)據權限、身份驗證、訪問控制等,來保障數(shù)據的安全性。

3、任務調度

Rapids Lizard的任務調度部分由Rapids Schedulis負責,它基于去中心化架構,是一個分布式易擴展的可視化工作流任務調度平臺。以可視化DAG工作流、任務調度、資源管理等功能,致力于解決Rapids Lizard平臺中的復雜數(shù)據處理和計算資源分配問題。

其具體組件包括:

MasterServer:主要負責DAG任務切分、任務提交,以及檢測健康狀態(tài)

WorkferServer:支持定義任務插件,負責任務執(zhí)行和日志服務

RapidsDB:工作流元數(shù)據管理、告警相關功能支持

API:處理前端UI請求。提供統(tǒng)一RESTFUL API服務

UI:系統(tǒng)前端頁面

四、應用場景與收益

采用柏睿大數(shù)據平臺Rapids Lizard基于無中心分布式架構,具備了橫向擴展能力、高數(shù)據負載均衡性、低運維成本、低延遲和高吞吐量等優(yōu)勢,能夠更好地應對實時數(shù)據處理要求。

因此,Rapids Lizard適用于金融、運營商、交通等行業(yè)中數(shù)據量大、安全性要求高的業(yè)務場景中,以及智能短信、搶購秒殺等對實時性能和并發(fā)性能要求高的實時分析場景中,同時非常有利于在云上提供高性價比的服務,讓企業(yè)的大數(shù)據應用更高效、更安全、更簡便靈活、更高性價比,加速實現(xiàn)數(shù)字化運營,驅動業(yè)務增長和創(chuàng)新。

某地市軌道交通公司依托柏睿大數(shù)據平臺Rapids Lizard,搭建了基于無中心分布式架構的智慧交通大數(shù)據平臺,充分解決了用戶數(shù)據量大且多元化及應用架構復雜化帶來的性能瓶頸、數(shù)據安全等問題,同時實現(xiàn)了平臺長期安全穩(wěn)定的運轉,不僅在日程使用過程中,實現(xiàn)了存儲、計算資源的統(tǒng)一負載管理,還在運維管理中滿足了數(shù)據多副本、數(shù)據多種形式備份、數(shù)據分區(qū)容錯等要求。

五、未來展望

柏睿大數(shù)據平臺Rapids Lizard的無中心架構演變遵循技術和市場的發(fā)展趨勢,將朝著更加高性能、智能化、安全可靠、靈活的方向發(fā)展,以滿足數(shù)字經濟時代下大規(guī)模數(shù)據的實時采集、存儲、計算分析、治理與可視化需求。

Rapids Lizard的無中心架構重點關注以下技術發(fā)展方向:

智能化管理:Rapids Lizard的原生AI機器學習模塊AIworkflow通過對平臺內部數(shù)據的建模分析,能夠實現(xiàn)自動化的節(jié)點管理和控制,提高系統(tǒng)的可靠性和效率,還能夠對用戶系統(tǒng)進行預防性設備檢測和運維處理。未來Rapids Lizard將更深層運用機器學習和人工智能技術,實現(xiàn)平臺的智能化管理。

更加靈活的數(shù)據分片:未來的無中心架構將會采用更加靈活的數(shù)據分片方式,以適應數(shù)據的動態(tài)變化和多樣化的數(shù)據訪問需求。例如,可以使用動態(tài)數(shù)據分片技術來自適應數(shù)據的變化,并根據數(shù)據的重要性和訪問頻率進行優(yōu)化。

更智能的故障恢復機制:未來的無中心架構可能會使用更加智能的故障恢復機制來提高系統(tǒng)的可用性和穩(wěn)定性。例如,可以使用自動化故障檢測和恢復技術來快速發(fā)現(xiàn)故障并自動化修復。

超大規(guī)模數(shù)據處理:目前Rapids Lizard能夠滿足PB級別海量數(shù)據的穩(wěn)定存儲和高效分析,未來也會向著超大規(guī)模的平臺集群演進。

云原生應用:無中心架構具備適應云原生應用的獨特優(yōu)勢,支持快速部署和擴展應用程序,未來Rapids Lizard將同時滿足本地化部署和云原生,以適應用戶靈活多變的交付需求。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )