原創(chuàng)數(shù)據(jù)庫多卡加速新方法 申威睿思發(fā)明層級(jí)化數(shù)據(jù)庫操作加速系統(tǒng)和方法

數(shù)字經(jīng)濟(jì)發(fā)展最大的特征是數(shù)據(jù)作為其核心生產(chǎn)要素,而數(shù)據(jù)庫作為其全生命周期的最核心載體,其應(yīng)用速度和分析性能等成為數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵所在。業(yè)界從2010年開始密集研究通過硬件(FPGA)等硬件對(duì)數(shù)據(jù)庫進(jìn)行加速,然而數(shù)據(jù)庫加速的主要障礙是軟件與硬件耦合度極高,硬件實(shí)現(xiàn)大量軟件算法,技術(shù)門檻極高。

申威睿思作為國內(nèi)首家專業(yè)從事數(shù)據(jù)中心加速領(lǐng)域的高階處理器SOC芯片公司,其核心團(tuán)隊(duì)擁有深厚的數(shù)據(jù)庫和硬件加速技術(shù)的研發(fā)功底以及豐富的應(yīng)用場(chǎng)景設(shè)計(jì)經(jīng)驗(yàn),在數(shù)據(jù)庫性能提升與數(shù)據(jù)中心/超算中心加速等技術(shù)場(chǎng)景中擁有大量自主創(chuàng)新性技術(shù)并獲得了多項(xiàng)國家發(fā)明專利。其中,申威睿思針對(duì)分布式數(shù)據(jù)庫的硬件加速技術(shù)已獲得了4項(xiàng)國家發(fā)明專利,同時(shí)完成了4項(xiàng)PCT國際發(fā)明專利申請(qǐng),并已經(jīng)正式進(jìn)入美國審查階段,完成在美國的專利布局。這4項(xiàng)自主創(chuàng)新的發(fā)明專利完成國際專利申請(qǐng)并正式進(jìn)入美國審查階段,一方面標(biāo)志著申威睿思中國“芯”力量在數(shù)據(jù)中心關(guān)鍵基礎(chǔ)技術(shù)方面的創(chuàng)新和突破,另一方面則體現(xiàn)了申威睿思的技術(shù)發(fā)展從國內(nèi)到國際的戰(zhàn)略性布局,展現(xiàn)了申威睿思意在更廣闊、競(jìng)爭(zhēng)更激烈的國際市場(chǎng)上群雄逐鹿的決心。

此次申威睿思的四項(xiàng)發(fā)明專利主要圍繞分布式數(shù)據(jù)庫系統(tǒng)加速方法和裝置發(fā)明,涵蓋從系統(tǒng)方法、操作加速、數(shù)據(jù)傳輸、存儲(chǔ)和裝置等四個(gè)方面原創(chuàng)發(fā)明。

本次分享的是針對(duì)數(shù)據(jù)中心單節(jié)點(diǎn)數(shù)據(jù)庫加速瓶頸的難題,提出了全球原創(chuàng)性的發(fā)明——層級(jí)化數(shù)據(jù)庫操作加速系統(tǒng)和方法,為大幅度提升大量數(shù)據(jù)中心的數(shù)據(jù)庫性能提供了行之有效的原創(chuàng)性系統(tǒng)方法和技術(shù)方案。

眾所周知,數(shù)據(jù)庫單節(jié)點(diǎn)采用單張F(tuán)PGA加速卡加速其性能增益存在上限,擴(kuò)展成多卡加速成為自然而然的選擇。

目前主流數(shù)據(jù)庫多卡加速的方案有兩種:

一、加速卡橫向擴(kuò)展

將2張及以上加速卡并行接入單節(jié)點(diǎn)對(duì)應(yīng)的PCIe插槽中。該節(jié)點(diǎn)針對(duì)多個(gè)可用加速器中的每一個(gè)的處理配置檢索成本信息,將一個(gè)或多個(gè)查詢操作卸載到多個(gè)加速器中進(jìn)行查詢加速和匯總。該方案存在主機(jī)存儲(chǔ)IO和CPU性能瓶頸,無法滿足性能線性提升要求。

二、加速卡縱向擴(kuò)展

通過一個(gè)PCIe接口加轉(zhuǎn)換器連接多個(gè)硬件加速器,并連接一個(gè)共享存儲(chǔ)設(shè)備,通過查詢分片的方式,將主機(jī)處理后的查詢分片分發(fā)到至少一個(gè)加速器上執(zhí)行并返回該分片的結(jié)果。該方案依然存在IO瓶頸,因此影響了單節(jié)點(diǎn)加速性能的提升。

要進(jìn)一步提升多加速卡的單節(jié)點(diǎn)數(shù)據(jù)庫系統(tǒng)的處理性能,提高數(shù)據(jù)查詢效率,我們開創(chuàng)性地發(fā)明了一種層級(jí)加速方法。

說明圖1

層級(jí)加速效應(yīng)倍增

層級(jí)化數(shù)據(jù)庫操作加速系統(tǒng),包含主機(jī)以及層級(jí)化加速模塊兩大部分,其中主機(jī)接收查詢計(jì)劃,并以此為依據(jù)生成相應(yīng)的查詢操作并進(jìn)行分發(fā),同時(shí)還接收并處理匯總執(zhí)行結(jié)果;而層級(jí)加速模塊通過PCIe接口與主機(jī)相連,接收主機(jī)分配的所述查詢操作并返回所述匯總執(zhí)行結(jié)果。

說明圖2

層級(jí)加速中包含一個(gè)主加速卡和至少一個(gè)從加速卡,主從加速卡相互連接,執(zhí)行被分配的查詢操作,產(chǎn)生執(zhí)行結(jié)果;從加速卡向主加速卡返回所述執(zhí)行結(jié)果,再由主加速卡完成所述執(zhí)行結(jié)果匯聚和被分配的后續(xù)查詢操作,向主機(jī)返回所述匯總執(zhí)行結(jié)果。為了提高數(shù)據(jù)庫操作的速度,主加速卡和從加速卡都設(shè)置有用于存儲(chǔ)數(shù)據(jù)的存儲(chǔ)單元,整個(gè)系統(tǒng)就形成多級(jí)存儲(chǔ)架構(gòu)。

說明圖3

主機(jī)根據(jù)數(shù)據(jù)分布信息和各加速卡的執(zhí)行能力信息將所述查詢計(jì)劃對(duì)應(yīng)的所述查詢操作分發(fā)至各加速卡,預(yù)設(shè)數(shù)據(jù)分布規(guī)則預(yù)先將主機(jī)側(cè)存儲(chǔ)器中存儲(chǔ)的數(shù)據(jù)加載存放到各加速卡存儲(chǔ)器中。主機(jī)接收到查詢請(qǐng)求時(shí),根據(jù)數(shù)據(jù)分布信息和各加速卡的執(zhí)行能力信息將查詢計(jì)劃分發(fā)至各加速卡操作,操作可包括掃描、連接、排序和匯聚操作。

主從加速卡之間可通過PCIe數(shù)據(jù)總線或超高速網(wǎng)絡(luò)接口連接,主加速卡和從加速卡具備對(duì)數(shù)據(jù)進(jìn)行加密和壓縮,以及解密和解壓的功能。

靈活配搭 廣泛應(yīng)用

在層級(jí)加速模塊中,主從加速卡可以為內(nèi)部硬件結(jié)構(gòu)相同的加速卡,可以實(shí)現(xiàn)相同的功能;也可以為內(nèi)部硬件結(jié)構(gòu)不同的加速卡,可以實(shí)現(xiàn)不同的功能;各從加速卡也可以為內(nèi)部硬件結(jié)構(gòu)不同的加速卡,可以實(shí)現(xiàn)不同的功能。在當(dāng)前主加速卡故障時(shí),則由預(yù)設(shè)的后繼加速卡接替當(dāng)前主加速卡。

說明圖4

為了提高數(shù)據(jù)查詢效率,主加速卡基于負(fù)載均衡將各剩余容量在各加速卡存儲(chǔ)器之間平均分配,或基于負(fù)載均衡將高于預(yù)設(shè)訪問頻次的熱點(diǎn)數(shù)據(jù)在各加速卡存儲(chǔ)器之間平均分配,或?qū)㈥P(guān)聯(lián)度高于預(yù)設(shè)值的數(shù)據(jù)存入同一個(gè)加速卡存儲(chǔ)器中。

主從加速卡的網(wǎng)絡(luò)接口包括Ethernet以太網(wǎng)、FC光纖通道、基于融合以太網(wǎng)的RDMAv2中的一種或多種。各加速卡通過外部的以太交換機(jī)實(shí)現(xiàn)高速互聯(lián)。也可以是其余任意一種加速卡支持的網(wǎng)絡(luò)交換設(shè)備,可以連接更多的同構(gòu)系統(tǒng)或加速卡,構(gòu)建更大規(guī)模的多卡加速系統(tǒng)。

說明圖5

此外,各加速卡中的一個(gè)或多個(gè)具備對(duì)數(shù)據(jù)進(jìn)行加密和壓縮、解密和解壓的功能。當(dāng)層級(jí)加速模塊啟用,從主機(jī)側(cè)的存儲(chǔ)介質(zhì)中加載加密和壓縮的數(shù)據(jù)庫數(shù)據(jù)時(shí),需要先由主加速卡完成數(shù)據(jù)的解壓和/或解密后,再分發(fā)到各加速卡。通過在一張從加速卡上部署遠(yuǎn)端存儲(chǔ)訪問功能,支持連接遠(yuǎn)端存儲(chǔ)設(shè)備。

說明圖6

本發(fā)明的層級(jí)加速模塊中,主從加速卡的配搭組合靈活多變,可以滿足不同數(shù)據(jù)庫單機(jī)節(jié)點(diǎn)的加速需求,為各類數(shù)據(jù)中心的數(shù)據(jù)庫加速場(chǎng)景和創(chuàng)新應(yīng)用提供了創(chuàng)新性方法和實(shí)現(xiàn)路徑。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )