Cloudera用現(xiàn)代化企業(yè)數(shù)據(jù)架構(gòu),擁抱混合數(shù)據(jù)未來

(魏德齡/文)數(shù)據(jù)的發(fā)展能夠產(chǎn)生什么樣的魔法效益?跑步、騎車這類曾經(jīng)被很多人在中學(xué)時(shí)代視為枯燥的耐力項(xiàng)目,隨著秒表/碼表發(fā)展成為了智能表/功率計(jì),讓更多人在數(shù)據(jù)的爆發(fā)中發(fā)現(xiàn)此前未知的自我,比賽過程中運(yùn)動(dòng)員所實(shí)時(shí)共享出的數(shù)據(jù),也大大提升了觀賞度。如今,云計(jì)算大數(shù)據(jù)也照樣在體育賽事中嶄露頭角,足球比賽中實(shí)時(shí)分析產(chǎn)生的跑動(dòng)距離、點(diǎn)球方位的統(tǒng)計(jì),F(xiàn)1賽事中對(duì)于排位賽晉級(jí)圈速的估算、正賽中車輛之間的實(shí)時(shí)距離,全部給予了觀眾耳目一新的感覺。

這一切的背后正是數(shù)據(jù)的發(fā)展,不同位置多種來源的數(shù)據(jù)源源不斷的產(chǎn)生,如同一堆混亂的表格文件,在企業(yè)主的桌面上堆砌,其中蘊(yùn)涵著無數(shù)可能,也充滿了管理的煩惱。數(shù)據(jù)大爆發(fā)的背后,數(shù)據(jù)生態(tài)系統(tǒng)架構(gòu)也正在朝向未來進(jìn)化。

未來數(shù)據(jù)生態(tài)系統(tǒng)架構(gòu)

談及未來數(shù)據(jù)生態(tài)系統(tǒng)架構(gòu),普遍被大家所提及并達(dá)成共識(shí)的莫過于數(shù)據(jù)網(wǎng)格、數(shù)據(jù)編織、湖倉(cāng)一體這三個(gè)概念。

數(shù)據(jù)網(wǎng)格是指一種范式轉(zhuǎn)變,其中數(shù)據(jù)由業(yè)務(wù)中的不同域擁有和管理?!八南敕ㄊ菙?shù)據(jù)與產(chǎn)品思維的融合,這個(gè)產(chǎn)品是講企業(yè)內(nèi)部里數(shù)據(jù)對(duì)外提供服務(wù)的方式。 ”Cloudera大中華區(qū)技術(shù)總監(jiān)劉隸放解釋稱。以往企業(yè)在分析領(lǐng)域的思路多是集中式的管控,對(duì)外進(jìn)行服務(wù),而數(shù)據(jù)網(wǎng)格范式基于域主權(quán)、數(shù)據(jù)為產(chǎn)品、自助式數(shù)據(jù)平臺(tái)、聯(lián)合計(jì)算治理四項(xiàng)原則。通過域主權(quán),數(shù)據(jù)成為一個(gè)產(chǎn)品,部門之間可以以產(chǎn)品的方式調(diào)用,規(guī)避了“影子IT”所帶來的一系列問題。

數(shù)據(jù)編織是一種跨平臺(tái)的數(shù)據(jù)整合方式,它不僅可以集合所有業(yè)務(wù)用戶的信息,還具有靈活且彈性的特點(diǎn),使得人們可以隨時(shí)隨地使用任何數(shù)據(jù)。“我們現(xiàn)在要做的事情,可能不光對(duì)人工的方式、手動(dòng)數(shù)據(jù)管理進(jìn)行服務(wù),也要對(duì)未來的機(jī)器學(xué)習(xí)、自動(dòng)的發(fā)現(xiàn)方式、對(duì)外進(jìn)行服務(wù),在這個(gè)框架里比以前要求更高。 ”劉隸放表示過去手動(dòng)的元數(shù)據(jù)管理現(xiàn)在正在被一種積極主動(dòng)的通過機(jī)器學(xué)習(xí)來構(gòu)建元數(shù)據(jù)的方法取代。Gartner在今年提出數(shù)據(jù)編織的終極目標(biāo)是為了數(shù)據(jù)的集成和訪問提供一種更靈活的,無縫的自動(dòng)化的方式,其中主要包括能夠連接的服務(wù)與提供自助的服務(wù)。

湖倉(cāng)一體集成并統(tǒng)一了數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖的功能,旨在支持單一平臺(tái)上的AI、BI、ML和數(shù)據(jù)工程。其集數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)湖之所長(zhǎng),并規(guī)避了兩者存在的一些問題,適用于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)工作負(fù)載,擁有減少數(shù)據(jù)冗余、成本效益,易于數(shù)據(jù)版本控制、治理和安全性等多重優(yōu)勢(shì)?!坝辛撕}(cāng)一體,我們可以在同一個(gè)平臺(tái)里同時(shí)實(shí)施數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖的需求,這個(gè)時(shí)候會(huì)提高成本效益。 ”劉隸放表示湖倉(cāng)一體去其實(shí)也是降本增效的一個(gè)思路。

人人獲益的三種方法論

值得一提的是,這三種正在被外界廣泛討論并認(rèn)可的方法論其實(shí)本身并不矛盾。劉隸放認(rèn)為面對(duì)企業(yè)內(nèi)部的不同角色,就需要講不同的數(shù)據(jù)架構(gòu)和方法論。

對(duì)于公司CEO或CIO而言,由于更關(guān)注如何在管理成本和維護(hù)人員規(guī)模的同時(shí)進(jìn)行擴(kuò)展,自然會(huì)關(guān)心數(shù)據(jù)網(wǎng)格,進(jìn)而平衡企業(yè)內(nèi)不同業(yè)務(wù)部門在組織架構(gòu)下的數(shù)據(jù)所有權(quán),以及數(shù)據(jù)和產(chǎn)品服務(wù)的方式。

對(duì)于CTO或CSO而言,其真正關(guān)心的是如何做技術(shù)方案與分析系統(tǒng),保持一致性并構(gòu)建標(biāo)準(zhǔn)模式,數(shù)據(jù)編織自然成為了關(guān)注的焦點(diǎn),如何用數(shù)據(jù)編織的方法豐富數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建方式,能夠?yàn)閷頇C(jī)器學(xué)習(xí)自主的治理提供服務(wù)。

對(duì)于領(lǐng)域從業(yè)者或技術(shù)人員而言,湖倉(cāng)一體則更為受用,可以理解為方法論,也可以理解為工具,尋求在具體項(xiàng)目上的優(yōu)化。

Gartner曾經(jīng)表示:“未來數(shù)據(jù)的生態(tài)系統(tǒng)應(yīng)該充分的利用分布式數(shù)據(jù)管理組件,可以在多個(gè)云和/或本地進(jìn)行運(yùn)行,但應(yīng)該被視為具有高度自動(dòng)化的緊密的整體,像集成、元數(shù)據(jù)管理和治理功能將各個(gè)組件粘合在一起。 ”

這就意味著,關(guān)于數(shù)據(jù)未來的三種方法論其實(shí)將會(huì)有機(jī)的融為一體,最終讓企業(yè)中的每個(gè)角色獲益。

擁抱混合數(shù)據(jù)未來

Cloudera的新定位恰恰呼應(yīng)了企業(yè)數(shù)據(jù)架構(gòu)的未來,這家混合數(shù)據(jù)公司給出的定位是:我們提供適用于數(shù)據(jù)編織、數(shù)據(jù)湖庫(kù)、數(shù)據(jù)網(wǎng)格和未來數(shù)據(jù)生態(tài)系統(tǒng)架構(gòu)要求的混合數(shù)據(jù)平臺(tái)的混合數(shù)據(jù)平臺(tái),允許客戶在多個(gè)公共和私有云以及本地訪問和分析數(shù)據(jù),使企業(yè)能夠做出由數(shù)據(jù)驅(qū)動(dòng)的明智決策,幫助企業(yè)建立由數(shù)據(jù)驅(qū)動(dòng)的未來。

實(shí)際上,CDP(Cloudera Data Platform) 是業(yè)界唯一適用于數(shù)據(jù)編織、數(shù)據(jù)湖庫(kù)、數(shù)據(jù)網(wǎng)格和未來數(shù)據(jù)生態(tài)系統(tǒng)架構(gòu)要求的混合數(shù)據(jù)平臺(tái)。 Cloudera的數(shù)據(jù)平臺(tái)實(shí)現(xiàn)了對(duì)于現(xiàn)代數(shù)據(jù)架構(gòu)的全面支持,產(chǎn)品技術(shù)能夠適應(yīng)數(shù)據(jù)網(wǎng)格、數(shù)據(jù)編織、湖倉(cāng)一體這三種架構(gòu)概念,同時(shí)在多云和本地部署上,都可以做到管理和分析。Cloudera的分析代碼經(jīng)過一次編寫即可跨平臺(tái)運(yùn)行。另外,SDX還能夠做到數(shù)據(jù)的統(tǒng)一安全管控和治理。

以靈活且簡(jiǎn)單的方式建立數(shù)據(jù)驅(qū)動(dòng)型文化、以性能和成本效益驅(qū)動(dòng)價(jià)值、以速度和控制拉動(dòng)企業(yè)增長(zhǎng)是Cloudera擁有的三大核心優(yōu)勢(shì)?!拔覀?nèi)匀恢铝τ趯?shí)現(xiàn)讓每個(gè)人都可以輕松訪問數(shù)據(jù)和分析的愿景,以及我們成為混合數(shù)據(jù)領(lǐng)導(dǎo)者的使命。我們相信,數(shù)據(jù)可以讓今天的不可能,在明天成為可能。”此前Cloudera的一篇官方文章中曾這樣表述。

對(duì)于眾多企業(yè)來說,數(shù)據(jù)正在源源不斷的出現(xiàn),如何利用數(shù)據(jù)挖掘其中價(jià)值,在未來或許比獲取更多數(shù)據(jù)更加重要。Cloudera的數(shù)據(jù)平臺(tái)將為企業(yè)帶來通過數(shù)據(jù)戰(zhàn)略在競(jìng)爭(zhēng)中實(shí)現(xiàn)“彎道超車”的機(jī)會(huì),混合數(shù)據(jù)方法即將成為企業(yè)未來的“必需品”。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-09-30
Cloudera用現(xiàn)代化企業(yè)數(shù)據(jù)架構(gòu),擁抱混合數(shù)據(jù)未來
Cloudera用現(xiàn)代化企業(yè)數(shù)據(jù)架構(gòu),擁抱混合數(shù)據(jù)未來

長(zhǎng)按掃碼 閱讀全文