新一代HTAP數(shù)據(jù)庫崛起,MySQL生態(tài)的最佳歸宿?

俗話說,天下大勢,合久必分、分久必合。

數(shù)據(jù)庫領(lǐng)域同樣如此。過去五十余年,數(shù)據(jù)庫經(jīng)歷OLTP和OLAP兩種需求漫長的融合-分離-再融合的過程。究其原因,數(shù)據(jù)庫的發(fā)展始終與用戶場景需求變遷緊密相關(guān)。如今,隨著云計(jì)算和大數(shù)據(jù)的興起,業(yè)務(wù)場景正在經(jīng)歷前所未有的變革,數(shù)據(jù)庫領(lǐng)域也掀起了一股HTAP浪潮。

Gartner在多次報(bào)告中強(qiáng)調(diào),HTAP是數(shù)據(jù)庫領(lǐng)域最重要的發(fā)展趨勢之一,也是用戶數(shù)字化轉(zhuǎn)型中重要的數(shù)據(jù)平臺。業(yè)界甚至認(rèn)為,HTAP的興起代表著數(shù)據(jù)庫大融合時(shí)代的開啟。

那么,為什么數(shù)據(jù)庫大廠和云服務(wù)巨頭們均紛紛押寶HTAP?開源+多云為何是HTAP普及的助推劑?面對新一代HTAP數(shù)據(jù)的崛起,多年積累形成的MySQL生態(tài)終于找到最佳歸宿?

HTAP數(shù)據(jù)庫是新瓶裝舊酒?

放在幾年前,HTAP可能還會被認(rèn)為是數(shù)據(jù)庫領(lǐng)域的小眾產(chǎn)品,是否成氣候還有待觀察。

而隨著數(shù)據(jù)資源、數(shù)據(jù)消費(fèi)習(xí)慣和數(shù)據(jù)驅(qū)動型場景發(fā)生巨大變化,用戶需求與傳統(tǒng)數(shù)據(jù)庫之間的供需矛盾日漸突出,使得HTAP這種具備“同時(shí)支持OLTP和OLAP、創(chuàng)新計(jì)算存儲框架、去ETL”等特征的新時(shí)代數(shù)據(jù)庫成為不可阻擋的趨勢。

如今,幾乎所有數(shù)據(jù)庫大廠和云服務(wù)巨頭都在布局HTAP。例如,OceanBase去年推出的 3.0版本中就正式宣布向HTAP數(shù)據(jù)庫進(jìn)軍;今年5月,Google Cloud發(fā)布HTAP云端數(shù)據(jù)庫AlloyDB,為PG用戶提供了HTAP數(shù)據(jù)庫服務(wù);再加上Oracle MySQL Heatwave,甚至連SnowFlake也發(fā)布Unistore來“蹭”HTAP的熱點(diǎn)。

如果細(xì)數(shù)近一年以來的HTAP新品,會發(fā)現(xiàn)幾乎全部都建立在云端之上。新一代HTAP+云正在成為數(shù)據(jù)庫市場重要的潮流。例如,PingCAP近日發(fā)布的TiDB 6.0,也是與云端緊密聯(lián)系的新一代HTAP數(shù)據(jù)庫。

事實(shí)上,PingCAP是HTAP數(shù)據(jù)庫領(lǐng)域非常重要的一個(gè)引領(lǐng)者。早在TiDB 3.0起,PingCAP就正式轉(zhuǎn)向HTAP,從OLTP主引擎+OLAP輔助能力,到OLTP引擎+外接分析引擎,再到OLTP引擎+融合分析引擎,PingCAP在HTAP領(lǐng)域穩(wěn)打穩(wěn)扎,一個(gè)版本上一個(gè)臺階。

如今,隨著TiDB 6.0的發(fā)布,針對HTAP進(jìn)行了更多成熟性改進(jìn),TPC-C 性能也較 5.0 版本提升達(dá)到 76.32%,TiDB 6.0還增強(qiáng)了多個(gè)企業(yè)級特性,以更好適合云時(shí)代用戶對于HTAP數(shù)據(jù)庫的需求。

固然,有人質(zhì)疑當(dāng)前HTAP是新瓶裝舊酒,并無太多新意。但業(yè)界普遍形成共識:新一代HTAP與過去完全不同,開源+云孕育而出,很多都有AI加持,而且是為數(shù)據(jù)敏捷而生,擁有過去前所未有的創(chuàng)新活力與迭代速度,并逐漸形成數(shù)據(jù)庫技術(shù)變革的新潮流。

PingCAP CTO 黃東旭也直言:“TiDB近年來的快速進(jìn)化與迭代,得益于開源和云的助力?!?/p>

開源+云,數(shù)據(jù)敏捷的助推劑

HTAP之所受到用戶青睞,某種程度是因?yàn)橛脩魧τ跀?shù)據(jù)敏捷性的極度渴求。

“在數(shù)字化時(shí)代,客戶最為在乎的是如何快速走向市場。這需要數(shù)據(jù)敏捷性,而HTAP恰恰是數(shù)據(jù)敏捷的核心能力。”黃東旭如是說。

最近幾年,“海量、實(shí)時(shí)、在線”的需求越來越廣泛,大量采用 MySQL 和 PostgreSQL 開源數(shù)據(jù)庫的新一代企業(yè)需要提升對于熱數(shù)據(jù)的實(shí)時(shí)在線分析能力,這類需求遍布幾乎所有的互聯(lián)網(wǎng)企業(yè)以及從事線上業(yè)務(wù)的數(shù)字化轉(zhuǎn)型企業(yè)。對于新鮮數(shù)據(jù)的實(shí)時(shí)分析能力直接決定了這些業(yè)務(wù)的生死存亡,傳統(tǒng)的 OLTP+OLAP+ETL 的數(shù)據(jù)架構(gòu)已經(jīng)嚴(yán)重阻礙了消費(fèi)者體驗(yàn),這種訴求催生了 HTAP 的技術(shù)變革。

而真正幫助HTAP與用戶需求完成對接的則是開源+云。眾所周知,開源近年來在數(shù)據(jù)庫領(lǐng)域的流行和影響力與日俱增,DB-Engines數(shù)據(jù)顯示,全球383款數(shù)據(jù)庫中開源數(shù)據(jù)庫占據(jù)51.7%,六款開源數(shù)據(jù)庫進(jìn)入到前十,開源正在成為像HTAP這種新時(shí)代數(shù)據(jù)庫的創(chuàng)新源泉。

以PingCAP的TiDB為例,其產(chǎn)品研發(fā)體系建立在開源體系和開源社區(qū)的基礎(chǔ)上,實(shí)現(xiàn)了一年一個(gè)大版本、一個(gè)月一個(gè)小版本的迭代速度。黃東旭透露道:“開源是TiDB的第一個(gè)增長引擎,通過開源體系,開發(fā)者、貢獻(xiàn)者、布道者和用戶能夠很好串聯(lián)起來,形成飛輪效應(yīng),讓產(chǎn)品能夠走向加速迭代和創(chuàng)新的正向循環(huán)?!?/p>

據(jù)悉,TiDB每年會有超過 40% 的代碼更新,而這些代碼有很大一部分由外部貢獻(xiàn)者所共享。TiDB開源項(xiàng)目一直在全球和中國開源項(xiàng)目活躍度中名列前茅。

如果說開源改變了HTAP產(chǎn)品的開發(fā)模式和迭代速度,那么云則能夠?yàn)镠TAP產(chǎn)品提供用戶最為直接的需求反饋。眾所周知,云數(shù)據(jù)庫一改以往傳統(tǒng)數(shù)據(jù)庫部署、運(yùn)維、擴(kuò)展等難題,以云服務(wù)的方式讓數(shù)據(jù)庫使用更加簡單;更加關(guān)鍵的是,隨著云計(jì)算的普及,云上用戶群體持續(xù)增加,來自云上用戶群體的需求反饋無時(shí)無刻都在發(fā)生,對于數(shù)據(jù)庫產(chǎn)品的進(jìn)化與迭代至關(guān)重要。

“真正的產(chǎn)品迭代是如何縮短用戶問題/需求的反饋時(shí)間。云無疑為數(shù)據(jù)庫等基礎(chǔ)軟件提供了這樣的價(jià)值,讓產(chǎn)品可以更好地迭代。”黃東旭如是說。以TiDB為例,自去年五月全托管的數(shù)據(jù)庫即服務(wù)(DBaaS)產(chǎn)品 TiDB Cloud 公測版發(fā)布以來,已經(jīng)陸續(xù)登陸亞馬遜云科技、谷歌云等全球知名云服務(wù)商的Marketplace,并在今年5月份正式全球商用;今年 6 月與阿里云合作上線阿里云云市場,成為為數(shù)不多的跨全球三朵云的數(shù)據(jù)庫服務(wù)。

新一代HTAP數(shù)據(jù)庫:MySQL生態(tài)的最佳歸宿?

在眾多數(shù)據(jù)庫產(chǎn)品之中,MySQL憑借著開源、免費(fèi)、適合互聯(lián)網(wǎng)場景等優(yōu)勢,常年位居全球最受歡迎數(shù)據(jù)庫的前三。根據(jù)Slintel網(wǎng)站的統(tǒng)計(jì)數(shù)據(jù),在全球關(guān)系型數(shù)據(jù)庫市場中,MySQL市場份額最高,達(dá)到43.04%。

過去二十年里,開源MySQL數(shù)據(jù)庫對于各行各業(yè)影響至深,捕獲了來自互聯(lián)網(wǎng)、金融、零售、交通等多個(gè)行業(yè)用戶的心,堪稱“萬人迷”。例如,在中國就有超過9成的金融機(jī)構(gòu)都應(yīng)用了MySQL數(shù)據(jù)庫。

但任何數(shù)據(jù)庫潮流都是“需求變化+技術(shù)變革+架構(gòu)創(chuàng)新”融合的產(chǎn)物,MySQL是如此,HTAP亦不例外。如今,場景的數(shù)據(jù)規(guī)模、業(yè)務(wù)并發(fā)量、處理速度要求跟以往相比早已不是一個(gè)數(shù)量級。此時(shí),MySQL數(shù)據(jù)庫的局限性愈發(fā)突出,擴(kuò)展性很難滿足用戶需求,想繼續(xù)獲得增長的企業(yè)不得不使用分庫分表方案,但這又會造成數(shù)據(jù)架構(gòu)的復(fù)雜性。

新一代HTAP數(shù)據(jù)庫無需分庫分表,且具備實(shí)時(shí)海量規(guī)模的OLTP和實(shí)時(shí)數(shù)據(jù)分析能力,還擁有極為出色的擴(kuò)展性,與很多業(yè)務(wù)場景的海量交易實(shí)時(shí)數(shù)據(jù)展現(xiàn)、平穩(wěn)運(yùn)行的需求高度契合,HTAP憑借技術(shù)架構(gòu)優(yōu)勢崛起已成必然。

“用戶需求側(cè)最大的變化就是很多用戶需要借助熱數(shù)據(jù)實(shí)現(xiàn)運(yùn)營級別的實(shí)時(shí)分析,獲得實(shí)時(shí)洞察以支持決策,這極大推動了新一代HTAP數(shù)據(jù)庫的需求。”PingCAP副總裁劉松補(bǔ)充道。

雖然MySQL已經(jīng)增加列存引擎Heatwave來獲得HTAP能力,但主要解決規(guī)模化查詢的問題,系統(tǒng)本身架構(gòu)并未產(chǎn)生革命性變化,擴(kuò)展能力、OLTP吞吐量依然有著很大局限。“智能新能源汽車跟傳統(tǒng)燃油車在外表看幾乎沒區(qū)別。數(shù)據(jù)庫也類似,像TiDB這種新一代HTAP數(shù)據(jù)庫,從架構(gòu)設(shè)計(jì)、應(yīng)對場景和使用體驗(yàn)等角度,都與傳統(tǒng)數(shù)據(jù)庫有著極大的區(qū)別?!眲⑺尚蜗蟊扔鞯馈?/p>

事實(shí)上,與過去SAP HANA這種小眾、昂貴的HTAP不同,新一代HTAP擁有極強(qiáng)的兼容性,像Google Cloud、PingCAP這些數(shù)據(jù)庫廠商都借助新一代HTAP架構(gòu)為采用 MySQL或者PG開源數(shù)據(jù)庫的企業(yè)拓展 OLTP和OLAP的能力范圍。

例如,Google Cloud發(fā)布的HTAP云端數(shù)據(jù)庫AlloyDB,為單機(jī)版PG生態(tài)用戶提供了最好選擇,TiDB則成為MySQL生態(tài)的最佳歸宿。PingCAP大量用戶中有很多TiDB與MySQL混合部署的成功案例;得益于 TiDB 的開放性,TiDB 也可通過和其他數(shù)據(jù)服務(wù)產(chǎn)品“混搭”形成新的數(shù)據(jù)服務(wù)解決方案, 如通過同樣是開源的大數(shù)據(jù)計(jì)算引擎 Flink 混搭形成實(shí)時(shí)數(shù)倉解決方案,擴(kuò)展 HTAP 數(shù)據(jù)庫的能力邊界。

圖:早期TiDB與MySQL并存

黃東旭則直言,HTAP數(shù)據(jù)庫除了產(chǎn)品、技術(shù)之外,尤為需要關(guān)心用戶體驗(yàn),“HTAP應(yīng)該讓用戶覺得好用,屏蔽掉數(shù)據(jù)庫的復(fù)雜性?!睋?jù)悉,PingCAP是2022 Gartner Peer Insights“Voice of the Customer” 云數(shù)據(jù)庫領(lǐng)域唯一入選的中國數(shù)據(jù)庫公司,客戶總體評分達(dá)到 4.7 分(滿分 5 分),在所有入選企業(yè)中位列第一。在參與Gartner Peer Insights評分的PingCAP用戶中,像互聯(lián)網(wǎng)、金融等重點(diǎn)行業(yè)用戶均高度認(rèn)可HTAP現(xiàn)代數(shù)據(jù)庫理念。

總體來看,今年是HTAP的大年,各大廠商紛紛在市場中上新。隨著新一代HTAP數(shù)據(jù)庫產(chǎn)品的增多,整個(gè)市場對于HTAP數(shù)據(jù)庫理念和產(chǎn)品的接受與采用將會提速。而隨著新一代HTAP數(shù)據(jù)庫持續(xù)完善,讓廣大MySQL生態(tài)用戶群真正看到了大數(shù)據(jù)時(shí)代一條絕佳的遷移路徑。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-07-14
新一代HTAP數(shù)據(jù)庫崛起,MySQL生態(tài)的最佳歸宿?
PingCAP大量用戶中有很多TiDB與MySQL混合部署的成功案例;得益于TiDB的開放性,TiDB也可通過和其他數(shù)據(jù)服務(wù)產(chǎn)品“混搭”形成新的數(shù)據(jù)服務(wù)解決方案,如通過同樣是開源的大數(shù)據(jù)計(jì)算引

長按掃碼 閱讀全文