巨杉數(shù)據(jù)庫:金融級(jí)數(shù)據(jù)庫是怎樣煉成的

巨杉數(shù)據(jù)庫SequoiaDB是一家特立獨(dú)行的金融級(jí)數(shù)據(jù)庫廠商。大型企業(yè)客戶需要“原廠”金融級(jí)數(shù)據(jù)庫產(chǎn)品和服務(wù),巨杉數(shù)據(jù)庫堅(jiān)持以此為宗旨,歷經(jīng)6年從1.0到3.0的不斷迭代創(chuàng)新,目前已經(jīng)廣泛應(yīng)用于銀行、證券、保險(xiǎn)、政府、電信等大型企業(yè)的核心生產(chǎn)系統(tǒng)。

  巨杉聯(lián)合創(chuàng)始人王濤表示,在業(yè)務(wù)量爆炸性增長的今天,傳統(tǒng)數(shù)據(jù)庫正面臨著巨大的挑戰(zhàn),例如Oracle、DB2,其擴(kuò)展能力和性價(jià)比都存在相當(dāng)?shù)木窒扌?。大型企業(yè)需要的是既有分布式能力,又如Oracle這樣能達(dá)到金融級(jí)水準(zhǔn)的數(shù)據(jù)庫產(chǎn)品。
  因此,在6年不斷成長創(chuàng)新迭代中,巨杉改變了國產(chǎn)數(shù)據(jù)庫長期低迷的狀態(tài)。在分布式領(lǐng)域,巨杉數(shù)據(jù)庫已經(jīng)走在Oracle 12c的前面。
  “金融級(jí)”的核心來自于原廠的產(chǎn)品能力
  大型企業(yè)IT的管理是個(gè)非常復(fù)雜的過程,既要考慮技術(shù)的先進(jìn)性,也要滿足各種系統(tǒng)的兼容、合規(guī)以及風(fēng)控的要求。因此,大型企業(yè)在選擇技術(shù)產(chǎn)品時(shí),首先要判斷該產(chǎn)品是否滿足企業(yè)級(jí)需求。
  除了高性能與可靠性以外,企業(yè)級(jí)最根本的核心是產(chǎn)品化,適用于多種負(fù)載及業(yè)務(wù)場景;以及原廠支持能力,并且提供源代碼及內(nèi)核開發(fā)人員級(jí)別的技術(shù)支撐。
  互聯(lián)網(wǎng)公司的技術(shù)發(fā)展路線是以解決自身業(yè)務(wù)的特定場景和功能為目的,并不考慮產(chǎn)品化,這和面向大型企業(yè)的產(chǎn)品發(fā)展路線相比,是兩種不同的模式。這也是為什么互聯(lián)網(wǎng)巨頭也很難推出金融級(jí)產(chǎn)品的原因。
  所以說,滿足金融級(jí)需求的核心要素是原廠產(chǎn)品能力,即完全自主掌控產(chǎn)品代碼和產(chǎn)品的發(fā)展路線。
  銀行是金融級(jí)應(yīng)用的標(biāo)桿
  以銀行為首的金融行業(yè)占據(jù)了50%以上的企業(yè)級(jí)IT投入,接著才是政府、運(yùn)營商等行業(yè)。一般來說,一家銀行通常擁有超過百種以上的業(yè)務(wù)系統(tǒng),而且歷經(jīng)幾十年的法律和業(yè)務(wù)規(guī)則的演進(jìn)。因此,業(yè)界公認(rèn)銀行在選擇技術(shù)產(chǎn)品過程中,對于安全性、可靠性、復(fù)雜度等企業(yè)級(jí)功能要求最為嚴(yán)苛。
  銀行作為企業(yè)級(jí)軟件應(yīng)用的標(biāo)桿行業(yè),被其采用的產(chǎn)品達(dá)到了金融級(jí)產(chǎn)品的最高標(biāo)準(zhǔn),自然更能夠滿足其他行業(yè)的要求。
  1、銀行用戶對于產(chǎn)品的選擇非常嚴(yán)苛,為什么這么多銀行會(huì)選擇巨杉數(shù)據(jù)庫呢?
  這得益于巨杉的企業(yè)級(jí)基礎(chǔ)軟件基因。巨杉的研發(fā)技術(shù)以IBM DB2數(shù)據(jù)庫和華為分布式技術(shù)團(tuán)隊(duì)為班底,是中國最好的“原廠”數(shù)據(jù)庫產(chǎn)品團(tuán)隊(duì)。
  巨杉數(shù)據(jù)庫經(jīng)過6年從1.0到3.0的不斷迭代創(chuàng)新,歷經(jīng)了大中型銀行核心生產(chǎn)系統(tǒng)的嚴(yán)格驗(yàn)證和洗禮,厚積薄發(fā),才成為被銀行金融業(yè)界所信任的金融級(jí)數(shù)據(jù)庫產(chǎn)品。
  2、數(shù)據(jù)庫產(chǎn)品的發(fā)展曲線和生命周期都比較長,這是什么原因呢?巨杉對于此的觀點(diǎn)怎么樣的呢?
  的確如此,數(shù)據(jù)庫是基礎(chǔ)性軟件,好比汽車的引擎一樣,是任何系統(tǒng)的_關(guān)鍵部件,具有“牽一發(fā)而動(dòng)全身“的特性。這就要求數(shù)據(jù)庫具有相當(dāng)高的成熟度。這種成熟度需要在技術(shù)、產(chǎn)品、工程、支持以及行業(yè)經(jīng)驗(yàn)上具有相當(dāng)長時(shí)間的積累。
  傳統(tǒng)的關(guān)系型數(shù)據(jù)庫中,例如Oracle、IBM DB2等,都?xì)v經(jīng)20多年才達(dá)到現(xiàn)在的版本。任何一款數(shù)據(jù)庫從研發(fā)到產(chǎn)品都是一個(gè)歷經(jīng)磨難的過程,一般需要6年以上的時(shí)間才能走出0到1 的階段,然后再在行業(yè)和實(shí)際應(yīng)用場景中不斷地歷煉打磨,逐步過渡到成熟期。
  另外,金融級(jí)數(shù)據(jù)庫產(chǎn)品面對的是諸如銀行、證券、保險(xiǎn)等頭部行業(yè)大型企業(yè),對產(chǎn)品上的復(fù)雜度和成熟度又提出了更高層次的要求。因此,其生命周期還要更長。
  SequoiaDB作為金融級(jí)數(shù)據(jù)庫產(chǎn)品歷經(jīng)6年發(fā)展,進(jìn)入3.0時(shí)代,得到上百家大型銀行等大型客戶的采用和信任。這標(biāo)志著巨杉數(shù)據(jù)庫已經(jīng)進(jìn)入了數(shù)據(jù)庫生命曲線的成熟期。
  3、巨杉一直堅(jiān)持“原廠”,這是為什么?
  這和巨杉的商業(yè)模式息息相關(guān)。巨杉主營是數(shù)據(jù)庫產(chǎn)品及服務(wù),服務(wù)于很上百家大型的企業(yè),上千的業(yè)務(wù)系統(tǒng),每年還在不斷地增長。數(shù)據(jù)庫作為基礎(chǔ)工具型軟件,要滿足各種系統(tǒng)需求,而不為單一特定的場景服務(wù)。做到這點(diǎn)的核心就是“原廠”掌握核心代碼,掌控產(chǎn)品路線,能夠快速應(yīng)對客戶需求的同時(shí)也能保證產(chǎn)品化。
  我們都知道,細(xì)節(jié)定成敗,實(shí)踐出真知,技術(shù)實(shí)力的背后是產(chǎn)品能力。一個(gè)成熟的產(chǎn)品需要不斷的在大規(guī)模的金融級(jí)應(yīng)用中實(shí)踐與礪煉。這個(gè)過程就是不斷爬坑、不斷積累經(jīng)驗(yàn)和不斷完善細(xì)節(jié)。
  這對一個(gè)產(chǎn)品研發(fā)的工程及管理能力提出了相當(dāng)高的要求。例如巨杉數(shù)據(jù)庫產(chǎn)品的測試,產(chǎn)品達(dá)到99%以上自動(dòng)化測試覆蓋率,為保障質(zhì)量,每個(gè)小版本的測試都涉及12,000個(gè)以上的測試用例,橫跨超1000個(gè)服務(wù)器節(jié)點(diǎn)。
  只有這樣,我們的產(chǎn)品才能做到只用一個(gè)產(chǎn)品、一個(gè)研發(fā)團(tuán)隊(duì)來滿足所有的客戶,提供“原廠”代碼級(jí)別的支撐服務(wù)。
  4、巨杉數(shù)據(jù)庫和Oracle, MySQL這樣的傳統(tǒng)關(guān)系型數(shù)據(jù)庫的關(guān)系和對比是怎么樣的?有何優(yōu)勢?”
  巨杉的發(fā)展目標(biāo)就是想成為“分布式”的“Oracle”。怎么解釋呢,就是說從金融級(jí)產(chǎn)品能力和服務(wù)能力要達(dá)到Oracle的水準(zhǔn),但又是分布式的新一代數(shù)據(jù)庫。巨杉在分布式領(lǐng)域已經(jīng)處于領(lǐng)跑地位,跑在了Oracle 的前面。
  例如,巨杉數(shù)據(jù)庫在同一個(gè)分布式架構(gòu)下支持非結(jié)構(gòu)化的對象存儲(chǔ),能夠在高并發(fā)場景下處理多種結(jié)構(gòu)數(shù)據(jù),大規(guī)模地降低了運(yùn)維成本。這相比傳統(tǒng)數(shù)據(jù)庫是個(gè)獨(dú)特的優(yōu)勢。
  對比MySQL則大不相同,巨杉數(shù)據(jù)庫專注服務(wù)于大型的企業(yè),MySQL則是更偏向于互聯(lián)網(wǎng)、創(chuàng)業(yè)階段的中小企業(yè)市場,金融級(jí)產(chǎn)品標(biāo)準(zhǔn)和服務(wù)對象都不一樣。
  5、分布式數(shù)據(jù)庫真的是未來的方向嗎?
  這點(diǎn)毋庸置疑。分布式的研究來自于并行計(jì)算,這其實(shí)很早就有,不是個(gè)新鮮事物。只不過過去網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算成本比較高的時(shí)候,分布式的成本和性價(jià)高。造成做分布式數(shù)據(jù)庫從成本和應(yīng)用角度上不合適。
  現(xiàn)在網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算成本都大幅降低,這就是摩爾定律的威力。也是造成互網(wǎng)聯(lián)網(wǎng)在過去20年內(nèi)的高速發(fā)展。發(fā)展到了現(xiàn)在,這種利用x86服務(wù)器做分布式計(jì)算的能力已經(jīng)大幅度超越了傳統(tǒng)集中式的能力。加之現(xiàn)在數(shù)據(jù)使用的量級(jí)也是每年技術(shù)級(jí)的增長,傳統(tǒng)數(shù)據(jù)庫力不從心,因此從需求和技術(shù)能力兩個(gè)方面都使得分布式數(shù)據(jù)庫成為必然。
  6、現(xiàn)在大型企業(yè)就需要“兩地三中心”的說法,分布式數(shù)據(jù)庫能解決這個(gè)問題嗎?
  兩地三中心是指跨地域的數(shù)據(jù)中心,是分布式的最重要的應(yīng)用場景。Oracle在1992年開始就研究跨地域的數(shù)據(jù)同步,結(jié)果因?yàn)殛P(guān)系型的特點(diǎn),優(yōu)勢也成了劣勢,在分布式發(fā)展上非常失敗,所以回歸到集中模式了。
  這里面在術(shù)語上有“一致性”的問題,就是如何保證不同地域節(jié)點(diǎn)的數(shù)據(jù)相同。其中強(qiáng)一致指任何時(shí)候不同節(jié)點(diǎn)的數(shù)據(jù)都相同,而最終一致性指經(jīng)過很短的時(shí)間延遲后,不同節(jié)點(diǎn)的數(shù)據(jù)最后終會(huì)相同。這在過去傳統(tǒng)數(shù)據(jù)庫里不可調(diào)和。分布式解決這個(gè)問題的能力非常強(qiáng)大,可配置的一致性是分布式數(shù)據(jù)庫的重要部分,可以解決不同業(yè)務(wù)場景對不同一致性的需求。
  所以巨杉數(shù)據(jù)庫的特點(diǎn)之一就是支持兩地三中心的架構(gòu)。
  7、國外很多分布式的數(shù)據(jù)庫也開始提供SQL支持了,巨杉也支持是吧,這是為什么?
  巨杉支持SQL要回到2014年了,比國外同行起步早很多。巨杉當(dāng)時(shí)雖然在性能上獨(dú)樹一幟,但是很快發(fā)現(xiàn)客戶的開發(fā)和運(yùn)維都太習(xí)慣SQL了。SQL是個(gè)非常好的語言和工具,歷經(jīng)40年培養(yǎng)了大量的用戶人才和應(yīng)用習(xí)慣??梢哉f,99%的企業(yè)用戶都需要SQL。
  巨杉的技術(shù)驅(qū)動(dòng)來自于用戶和市場,所以當(dāng)機(jī)立斷,我們就開始增強(qiáng)對SQL的支持,到現(xiàn)在,我們同時(shí)支持高并發(fā)的標(biāo)準(zhǔn)SQL也支持分析型的Spark SQL,滿足不同的用戶需求。
  8、巨杉是NoSQL數(shù)據(jù)庫還是NewSQL,很多人都混淆,能解釋一下嗎?
  巨杉數(shù)據(jù)庫在經(jīng)歷了多年的發(fā)展以來,經(jīng)歷了從NoSQL向NewSQL再向關(guān)系型數(shù)據(jù)庫不斷演進(jìn)的過程,如今已經(jīng)支持標(biāo)準(zhǔn)SQL、OLTP、對象存儲(chǔ)以及JSON存儲(chǔ)等多種模式。
  根據(jù)Gartner的定義,如今的巨杉數(shù)據(jù)庫是一個(gè)典型的多模數(shù)據(jù)庫(Multi-Model Database),可以被當(dāng)做關(guān)系型OLTP數(shù)據(jù)庫使用的同時(shí),也支持半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)。
  9、在產(chǎn)品上,目前巨杉數(shù)據(jù)庫的對標(biāo)目標(biāo)已經(jīng)是Oracle而超越了MongoDB,在企業(yè)級(jí)市場特別是銀行,為什么能夠比MongoDB更為成功?
  巨杉數(shù)據(jù)庫 3.0是一款分布式對象存儲(chǔ)、分布式文檔型和分布式OLTP全覆蓋的多模(Multi-Model)金融級(jí)分布式數(shù)據(jù)庫,而MongoDB,couchbase等產(chǎn)品僅相當(dāng)于巨杉數(shù)據(jù)庫的一個(gè)子集。
  SequoiaDB從開始之初就定位于原廠的金融級(jí)產(chǎn)品,1.0版本起就直接被銀行企業(yè)采用。MongoDB是面向開發(fā)者、程序員的數(shù)據(jù)庫產(chǎn)品,幫助開發(fā)快速迭代。所以SequoiaDB和MongoDB的出發(fā)點(diǎn)截然不同。
  SequoiaDB從2.0版本開始,向著分布式多模數(shù)據(jù)庫不斷演進(jìn),大力發(fā)展SQL支持能力。不管從功能上還是性能上都超越MongoDB。
  巨杉數(shù)據(jù)庫的商業(yè)模式對標(biāo)Oracle,以大型企業(yè)為服務(wù)對象,而MongoDB則服務(wù)于長尾的中小型企業(yè)市場,雙方的用戶領(lǐng)域大不相同。因此巨杉并沒有把MongoDB作為對標(biāo)產(chǎn)品和競爭對手。
  10、2012年成立至今,巨杉數(shù)據(jù)庫經(jīng)歷哪幾個(gè)發(fā)展階段?整個(gè)產(chǎn)品打磨經(jīng)歷了多長時(shí)間?
  2012年,巨杉數(shù)據(jù)庫在公司成立之初,利用分布式的特征提高性能,解決傳統(tǒng)關(guān)系型的性能瓶頸。最早的版本是分布式文檔型數(shù)據(jù)庫,分布式架構(gòu)下主要以高并發(fā)性能為優(yōu)勢特點(diǎn)。
  2015年初 2.0版本開始向多模(Multi-Model)的分布式數(shù)據(jù)庫發(fā)展,包括OLTP和SQL的支持,增加高并發(fā)查詢的SQL引擎和分析為主的Spark SQL引擎,并成為了Spark的全球14個(gè)發(fā)行商之一。
  同時(shí),巨杉也開發(fā)分布式對象存儲(chǔ)引擎,在同一個(gè)分布式架構(gòu)下能同時(shí)管理操作記錄型數(shù)據(jù)和非結(jié)構(gòu)化的塊結(jié)構(gòu)數(shù)據(jù)。
  2017年巨杉數(shù)據(jù)庫全面支持高性能海量數(shù)據(jù)處理,事務(wù)處理,數(shù)據(jù)庫級(jí)別的HTAP以及對象存儲(chǔ)等多種應(yīng)用場景,并繼續(xù)加強(qiáng)分布式OLTP的能力。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-04-27
巨杉數(shù)據(jù)庫:金融級(jí)數(shù)據(jù)庫是怎樣煉成的
巨杉數(shù)據(jù)庫SequoiaDB是一家特立獨(dú)行的金融級(jí)數(shù)據(jù)庫廠商。

長按掃碼 閱讀全文