臻和(北京)科技有限公司正在構(gòu)建從基因測(cè)序數(shù)據(jù)生產(chǎn),到樣本數(shù)據(jù)挖掘分析,再到備份保存和群體復(fù)查的信息流全生命周期管理,浪潮天梭TS10000高性能集群解決方案采用了TStor3000并行存儲(chǔ)系統(tǒng),有力支撐了腫瘤個(gè)體化精準(zhǔn)診療和伴隨診斷的科學(xué)研究與商業(yè)運(yùn)營(yíng),實(shí)現(xiàn)了對(duì)存儲(chǔ)資源的最大化利用,幫助臻和科技提升生產(chǎn)效率,個(gè)體基因測(cè)序數(shù)據(jù)運(yùn)行時(shí)間縮短了50%。
美國(guó)癌癥學(xué)會(huì)官方期刊發(fā)表的《2018年全球癌癥統(tǒng)計(jì)數(shù)據(jù)》報(bào)告顯示,中國(guó)已成為癌癥發(fā)病率、死亡率最高的國(guó)家,全球每新增100個(gè)癌癥患者中就有21個(gè)中國(guó)人。在中國(guó),平均每分鐘有7個(gè)人確診癌癥,每分鐘有將近5人死于癌癥,腫瘤精準(zhǔn)診療已成為迫切而必要的趨勢(shì)。
作為改善腫瘤患者生命質(zhì)量的引領(lǐng)者,臻和(北京)科技有限公司(以下簡(jiǎn)稱臻和科技)借助浪潮TStor3000并行存儲(chǔ)系統(tǒng),得以高效的開展針對(duì)主要癌癥的基因病理特征、個(gè)體化精準(zhǔn)診療和伴隨診斷等醫(yī)學(xué)研究與醫(yī)療服務(wù)。浪潮TStor3000是基于目前歐洲非常流行的BeeGFS商業(yè)版并行文件系統(tǒng)開發(fā)和優(yōu)化版本,專門針對(duì)高性能用戶需求設(shè)計(jì)的并行存儲(chǔ)系統(tǒng)。
基因研究的“小”困擾
臻和科技創(chuàng)立于2014年,以二代測(cè)序技術(shù)和生物信息學(xué)為核心,從事無創(chuàng)為主的腫瘤個(gè)體化精準(zhǔn)診療和伴隨診斷。目前,臻和科技已建立優(yōu)化的游離DNA提取及定量檢測(cè)技術(shù)平臺(tái),具備國(guó)內(nèi)首創(chuàng)的基于游離DNA檢測(cè)的多個(gè)實(shí)體腫瘤的伴隨診斷、預(yù)后評(píng)估、用藥指導(dǎo)的技術(shù)平臺(tái)。
信息流的全生命周期管理是臻和科技研發(fā)、生產(chǎn)與醫(yī)學(xué)檢測(cè)等各項(xiàng)業(yè)務(wù)的基礎(chǔ)所在,它涵蓋了大量測(cè)序數(shù)據(jù)的產(chǎn)生、挖掘分析、備份保存以及群體復(fù)查等環(huán)節(jié)。在信息流的全生命周期管理過程,臻和科技面臨的一大挑戰(zhàn)在于小文件的并行處理與高擴(kuò)展性的分布式存儲(chǔ),HPC系統(tǒng)在這方面的性能表現(xiàn),將直接影響到科研進(jìn)度與相應(yīng)醫(yī)療服務(wù)的開展。
臻和科技早期癌癥診斷類的基因序列數(shù)據(jù)通常由千萬到億萬條的基因片段組成,需要通過大量的比對(duì)和糾錯(cuò)才能拼接成完整的基因序列,隨后再經(jīng)過大量病例樣本數(shù)據(jù)的對(duì)比,找到誘發(fā)腫瘤病變的基因變異特征。在這一過程中,拼接結(jié)果的準(zhǔn)確程度、拼接的速度都與HPC提供的計(jì)算力息息相關(guān)。當(dāng)數(shù)據(jù)從高速的計(jì)算設(shè)備中被完整記錄和備份,進(jìn)入歸檔程序后,還需要進(jìn)入群體數(shù)據(jù)的回顧挖掘,積累出中國(guó)人群特有的癌癥基因數(shù)據(jù)庫,對(duì)存儲(chǔ)的高擴(kuò)展性有著較高要求。
周期縮短50%,浪潮基于BeeGFS的并行存儲(chǔ)系統(tǒng)來幫忙
此前,用于生命科學(xué)領(lǐng)域的HPC平臺(tái)多采用基于Lusture文件系統(tǒng),但在實(shí)際使用中效果并不理想。針對(duì)于此,浪潮為臻和科技設(shè)計(jì)了基于BeeGFS并行集群文件系統(tǒng)的高性能集群解決方案,率先實(shí)現(xiàn)了BeeGFS在國(guó)內(nèi)生命科學(xué)領(lǐng)域的部署。
浪潮天梭TS10000高性能計(jì)算集群系統(tǒng)能夠提供超過500個(gè)計(jì)算核心,計(jì)算峰值速度達(dá)到50TFlops/s(萬億次),可在4小時(shí)內(nèi)完成一個(gè)人的全基因序列拼接、比對(duì);存儲(chǔ)方面,TStor3000內(nèi)置的BeeGFS并行文件系統(tǒng)可提供極高的IO性能,充分發(fā)揮每塊硬盤的讀寫速度,滿足二代基因測(cè)序大文件帶寬需求,在處理三代基因測(cè)序場(chǎng)景下小文件并發(fā)的時(shí)候,BeeGFS也能發(fā)揮不錯(cuò)的效果。帶寬可以達(dá)到寫7GB/s讀5GB/s。
BeeGFS具備高性能、高可靠性、存取讀取方便等特點(diǎn),可以大大滿足用戶對(duì)數(shù)據(jù)安全可靠性、存取和維護(hù)的需求。其可為元數(shù)據(jù)和對(duì)象數(shù)據(jù)提供鏡像功能,使系統(tǒng)在半數(shù)服務(wù)器失效的情況下,業(yè)務(wù)不中斷,數(shù)據(jù)不丟失。BeeGFS還有一項(xiàng)非常有代表性的功能——BeeOND,用以滿足高性能用戶計(jì)算過程數(shù)據(jù)的讀寫需求,輕松達(dá)到高帶寬高IOPS的效果,并且可以通過作業(yè)調(diào)度系統(tǒng)快速地啟動(dòng)和關(guān)閉文件系統(tǒng),并將其中的重要數(shù)據(jù)快速地可以轉(zhuǎn)移到后端存儲(chǔ)中,既保證計(jì)算,又不影響數(shù)據(jù)存放。
在部署了浪潮天梭TS10000高性能集群系統(tǒng)后,臻和科技在系統(tǒng)易用性、生產(chǎn)效率提升、存儲(chǔ)成本降低上均獲得顯著改進(jìn)。臻和科技相關(guān)負(fù)責(zé)人表示:“通過BeeGFS的分布式存儲(chǔ)功能,我們實(shí)現(xiàn)了對(duì)存儲(chǔ)資源的最大化利用,有效降低了存儲(chǔ)開銷,并且滿足了對(duì)存儲(chǔ)安全性及數(shù)據(jù)全生命周期追溯的需求。同時(shí),系統(tǒng)易用性的提升極大的降低了使用門檻,從而提升了生產(chǎn)效率,個(gè)體基因測(cè)序時(shí)間縮短了50%。”
作為中國(guó)最早涉足生命科學(xué)領(lǐng)域的HPC解決方案提供商,浪潮對(duì)基因研究的應(yīng)用特點(diǎn)擁有深厚積累和深刻洞察,始終致力于以先進(jìn)計(jì)算技術(shù)及解決方案,推動(dòng)精準(zhǔn)醫(yī)療的發(fā)展。目前,浪潮高性能計(jì)算系統(tǒng)已經(jīng)在中科院北京基因組所、蘇州大學(xué)醫(yī)學(xué)部、上海兒童醫(yī)院等眾多醫(yī)學(xué)研究與醫(yī)療服務(wù)機(jī)構(gòu)部署,為解決人類面臨的重要醫(yī)學(xué)問題提供領(lǐng)先的計(jì)算力支撐。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。