親,你聽(tīng)過(guò)轉(zhuǎn)化醫(yī)學(xué)么?
所謂轉(zhuǎn)化醫(yī)學(xué)(Translational Medicine),顧名思義,核心就在于“轉(zhuǎn)化”。它不是單一的學(xué)科或技術(shù),而是突出一種多學(xué)科、多技術(shù)融合和轉(zhuǎn)化的狀態(tài),即從實(shí)驗(yàn)室到臨床(bench to bedside)、從臨床到實(shí)驗(yàn)室(bedside to bench)的應(yīng)用拓展。轉(zhuǎn)化醫(yī)學(xué)運(yùn)用現(xiàn)代分子生物學(xué)等技術(shù)將實(shí)驗(yàn)室研究成果轉(zhuǎn)化為臨床應(yīng)用的產(chǎn)品與技術(shù),同時(shí)通過(guò)臨床觀察與分析幫助實(shí)驗(yàn)室更好地認(rèn)識(shí)人體與疾病,并通過(guò)優(yōu)化實(shí)驗(yàn)設(shè)計(jì)來(lái)促進(jìn)基礎(chǔ)研究。目前,像新藥研發(fā)、醫(yī)療器械、醫(yī)療APP、分子診斷等都屬于轉(zhuǎn)化醫(yī)學(xué)的范疇。
轉(zhuǎn)化醫(yī)學(xué)也是當(dāng)下最熱門(mén)的醫(yī)療方向之一。畢竟在大眾的認(rèn)知中,能看好病的醫(yī)生才是好醫(yī)生,而轉(zhuǎn)化醫(yī)學(xué)就是將科研實(shí)驗(yàn)室中的研究成果轉(zhuǎn)換為實(shí)際的臨床成績(jī)——比如由上海瑞金醫(yī)院陳竺、陳賽娟院士研究推動(dòng)的采用全反式維甲酸+三氧化二砷誘導(dǎo)療法治療M3型急性白血病,就是轉(zhuǎn)化醫(yī)學(xué)的經(jīng)典成功案例。
為了把這些成功案例復(fù)刻、普及,以及創(chuàng)造更多經(jīng)典案例,轉(zhuǎn)化醫(yī)學(xué)中心的日常工作,就是圍繞基因組測(cè)序、轉(zhuǎn)錄組測(cè)序、藥物篩選等各種先進(jìn)組學(xué)等研究形成多維度的數(shù)據(jù)流,之后再對(duì)這些數(shù)據(jù)流進(jìn)行綜合分析和挖掘,提供與疾病診斷和治療相關(guān)的遺傳和臨床信息,待形成特征數(shù)據(jù)后再通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和人工智能等方法整合特征數(shù)據(jù)與臨床診療方案,成就真正意義上的精準(zhǔn)分析、輔助診斷和個(gè)性化醫(yī)療。
這是一項(xiàng)步驟繁瑣、流程漫長(zhǎng)、體量龐大的數(shù)據(jù)網(wǎng)絡(luò),其中僅單個(gè)人類全基因組測(cè)序分析涉及的數(shù)據(jù)就可能高達(dá)870 GB,所以對(duì)于這些數(shù)據(jù)的快速處理并最終快速形成結(jié)論,就顯得至關(guān)重要。因此,轉(zhuǎn)化醫(yī)學(xué)對(duì)于高性能計(jì)算平臺(tái)性能的需求較以往或者其他學(xué)科更高、也更嚴(yán)苛。
與病魔賽跑,轉(zhuǎn)化醫(yī)學(xué)更看重時(shí)效性
談到轉(zhuǎn)化醫(yī)學(xué)在中國(guó)的具體落地和實(shí)踐,就不得不提到轉(zhuǎn)化醫(yī)學(xué)國(guó)家重大科技基礎(chǔ)設(shè)施(上海)(以下簡(jiǎn)稱“國(guó)家轉(zhuǎn)化醫(yī)學(xué)中心”),它是中國(guó)首個(gè)也是目前國(guó)內(nèi)唯一建成的國(guó)家級(jí)綜合性轉(zhuǎn)化醫(yī)學(xué)中心,其重點(diǎn)研究方向聚焦腫瘤(包括白血?。?、代謝性疾病和心腦血管疾病等領(lǐng)域。作為一家現(xiàn)代化、數(shù)字化特色顯著的醫(yī)療科研單位,該中心瑞金基地設(shè)有300張病床,這些病床可通過(guò)智能設(shè)備及信息化技術(shù)組成多功能智慧臨床研究集群,每個(gè)床單元都具備自動(dòng)感知以及臨床研究數(shù)據(jù)自主集采功能。每天,這些病床采集的數(shù)據(jù)都通過(guò)后端的高性能計(jì)算平臺(tái)得到分析,以便相關(guān)團(tuán)隊(duì)有針對(duì)性地制定治療方案,而這也正是轉(zhuǎn)化醫(yī)學(xué)的主要應(yīng)用方式。
由此看來(lái),轉(zhuǎn)化醫(yī)學(xué)可謂一種新型、數(shù)字化醫(yī)療方式,它不同于傳統(tǒng)醫(yī)學(xué)的望聞問(wèn)切和常規(guī)的影像檢測(cè)手段,而更強(qiáng)調(diào)智能化以及算力的價(jià)值。同時(shí),由于醫(yī)療行業(yè)的特殊性,許多疾病的治療過(guò)程都可謂是“與病魔賽跑”,所以提前一天、一小時(shí)甚至一分鐘,都有可能增加患者存活和治愈的概率。在這種情況下,轉(zhuǎn)化醫(yī)學(xué)所用的計(jì)算平臺(tái)自然需要更快更強(qiáng),無(wú)論是在數(shù)據(jù)的處理,還是數(shù)據(jù)的存儲(chǔ)和應(yīng)用等方面,都對(duì)性能有著嚴(yán)苛的要求。
“因?yàn)槊總€(gè)患者的情況不一樣,相應(yīng)地,臨床研究及手術(shù)治療的手段也不一樣。國(guó)家轉(zhuǎn)化醫(yī)學(xué)中心的建立就是希望能夠在一個(gè)整體的地方,讓數(shù)據(jù)和信息得到快速流轉(zhuǎn)和共享。比如臨床數(shù)據(jù)進(jìn)來(lái)后馬上可以在我們的超算平臺(tái)上進(jìn)行計(jì)算,這些計(jì)算結(jié)果又會(huì)及時(shí)反饋給醫(yī)生,為其制定診療方案提供有用信息”,在談到利用IT與時(shí)間賽跑的重要性時(shí),ASTRA高性能計(jì)算平臺(tái)共同負(fù)責(zé)人呂綱如是說(shuō)。他所負(fù)責(zé)的ASTRA高性能計(jì)算平臺(tái)就是整個(gè)國(guó)家轉(zhuǎn)化醫(yī)學(xué)中心的“大腦”,負(fù)責(zé)分析和處理所有的臨床數(shù)據(jù),因此容不得半點(diǎn)遲緩。該平臺(tái)為此在通用計(jì)算上選配了英特爾至強(qiáng)可擴(kuò)展處理器,并導(dǎo)入了GPGPU來(lái)為特定應(yīng)用加速,這種異構(gòu)的平臺(tái)設(shè)計(jì),可以更好地保障充足算力的輸出。
但打造這樣一套快速響應(yīng)的IT系統(tǒng)可并非易事。要滿足轉(zhuǎn)化醫(yī)學(xué)科研團(tuán)隊(duì)和臨床醫(yī)生團(tuán)隊(duì)對(duì)海量數(shù)據(jù)進(jìn)行高速頻繁讀寫(xiě)和分析的需求,ASTRA不僅需要具備強(qiáng)勁的算力,還要擁有優(yōu)異的I/O和吞吐能力。在算法和算力突飛猛進(jìn)的今天,存儲(chǔ)架構(gòu)很容易成為高性能計(jì)算平臺(tái)拉胯的主要因素。目前流行的無(wú)論是SAN還是NAS存儲(chǔ),大多沿用的還是之前的架構(gòu),尤其是機(jī)械硬盤(pán)的大量使用對(duì)于高帶寬的支持并不友好;雖然目前業(yè)內(nèi)也有不少閃存甚至全閃存產(chǎn)品,但即便是在互聯(lián)網(wǎng)領(lǐng)域大行其道的Ceph存儲(chǔ),也難以滿足這樣的要求,同時(shí)考慮到未來(lái)的持續(xù)升級(jí)和快速擴(kuò)容,Ceph架構(gòu)也并非理想選擇。存儲(chǔ)難題就這樣,像一堵墻一樣攔在了平臺(tái)構(gòu)建的道路上,難道就真的沒(méi)有更合理的破解之道了嗎?
DAOS借力傲騰持久內(nèi)存,為“破墻”提供新思路
開(kāi)源分布式異步對(duì)象存儲(chǔ)(Distributed Asynchronous Object Storage, DAOS)的出現(xiàn),就是產(chǎn)業(yè)界對(duì)用戶上述焦慮與困境的回應(yīng),它能為業(yè)界打破高性能計(jì)算的存儲(chǔ)瓶頸或存儲(chǔ)墻提供全新思路。這是一種由英特爾開(kāi)發(fā)和開(kāi)源的軟件定義的橫向擴(kuò)展對(duì)象存儲(chǔ),與主要針對(duì)旋轉(zhuǎn)介質(zhì)設(shè)計(jì)的傳統(tǒng)存儲(chǔ)堆棧不同,DAOS圍繞英特爾主流非易失性存儲(chǔ)器(NVM)技術(shù)(包括英特爾傲騰持久內(nèi)存和英特爾傲騰固態(tài)盤(pán))的使用進(jìn)行了充分的優(yōu)化(詳見(jiàn)下圖)。
DAOS 架構(gòu)與傳統(tǒng)存儲(chǔ)系統(tǒng)的對(duì)比
那么DAOS的實(shí)戰(zhàn)性能到底如何呢?剛剛結(jié)束的德國(guó)ISC22世界超算大會(huì)公布了新一期的IO-500榜單。在這份榜單的前十名中,有一半都采用了DAOS存儲(chǔ)架構(gòu),這足以證明DAOS在高性能、低時(shí)延存儲(chǔ)應(yīng)用中的出色表現(xiàn)。
是什么讓DAOS架構(gòu)能夠得到這么多頂尖HPC系統(tǒng)的青睞,并能幫助它們躋身榜單前列呢?這就需要從它的設(shè)計(jì)理念說(shuō)起。
首先,相較其他分布式存儲(chǔ)系統(tǒng)多使用高時(shí)延的點(diǎn)對(duì)點(diǎn)通信的設(shè)計(jì),DAOS采用的是能夠繞過(guò)操作系統(tǒng)的低時(shí)延、高消息速率用戶空間通信。而且當(dāng)下大多數(shù)存儲(chǔ)系統(tǒng)都是針對(duì)塊I/O設(shè)計(jì)的,這種情況下所有I/O操作都需要通過(guò)塊接口在Linux內(nèi)核中進(jìn)行,從而會(huì)產(chǎn)生大量的開(kāi)銷(xiāo)。DAOS則優(yōu)化了對(duì)傲騰持久內(nèi)存及固態(tài)盤(pán)的訪問(wèn)來(lái)規(guī)避了這些不必要的開(kāi)銷(xiāo)。更具體一點(diǎn)說(shuō),DAOS會(huì)使用持久內(nèi)存開(kāi)發(fā)套件(PMDK)提供對(duì)于持久內(nèi)存的事務(wù)訪問(wèn),并使用存儲(chǔ)性能開(kāi)發(fā)套件(SPDK)為NVMe設(shè)備提供I/O。
其次,就架構(gòu)設(shè)計(jì)理念來(lái)說(shuō),DAOS是專為大規(guī)模分布式非易失性內(nèi)存而設(shè)計(jì),并以包括傲騰持久內(nèi)存在內(nèi)的SCM(存儲(chǔ)級(jí)內(nèi)存)和NVMe存儲(chǔ)為核心介質(zhì),可提供細(xì)粒度數(shù)據(jù)原生支持的I/O模型,這也是當(dāng)下以及未來(lái)熱數(shù)據(jù)應(yīng)用的先進(jìn)技術(shù)。DAOS還是獨(dú)立的高性能容錯(cuò)存儲(chǔ)層,無(wú)需依賴其它層便可進(jìn)行元數(shù)據(jù)及數(shù)據(jù)恢復(fù)能力管理;而在實(shí)際的應(yīng)用中,元數(shù)據(jù)可以保存在傲騰持久內(nèi)存,更多的批量數(shù)據(jù)則會(huì)存儲(chǔ)在NVMe固態(tài)盤(pán)中。
看到這里你應(yīng)該明白了,英特爾NVM技術(shù)或者更確切地說(shuō)英特爾傲騰持久內(nèi)存可以說(shuō)是DAOS的骨骼或基石。DAOS的架構(gòu)設(shè)計(jì)可充分發(fā)揮這款持久內(nèi)存自身,以及它與至強(qiáng)可擴(kuò)展處理器組合后的優(yōu)勢(shì),特別是憑借接近DRAM的性能和數(shù)倍于DRAM的容量,從而將更多數(shù)據(jù)存放在距算力、距處理器更近的地方,也就是讓更多數(shù)據(jù)的讀寫(xiě)和處理處于高速、大帶寬和低時(shí)延的狀態(tài)下。這也解釋了為什么在IO-500排名中DAOS架構(gòu)能夠一枝獨(dú)秀的原因。
瑞金醫(yī)院國(guó)家轉(zhuǎn)化醫(yī)學(xué)中心借DAOS打破存儲(chǔ)瓶頸,加速轉(zhuǎn)化醫(yī)學(xué)實(shí)踐
鑒于DAOS諸多優(yōu)勢(shì),瑞金醫(yī)院轉(zhuǎn)化醫(yī)學(xué)中心將其引入了ASTRA平臺(tái)來(lái)攻克存儲(chǔ)瓶頸。用呂綱的話說(shuō):“英特爾傲騰持久內(nèi)存的低時(shí)延、高帶寬、大容量、長(zhǎng)壽命、非易失等特性,再搭配專為高性能存儲(chǔ)硬件設(shè)計(jì)的DAOS開(kāi)源并行文件系統(tǒng),是我們成功構(gòu)建適用于轉(zhuǎn)化醫(yī)學(xué)應(yīng)用場(chǎng)景的高性能生信數(shù)據(jù)挖掘平臺(tái)ASTRA的關(guān)鍵,讓我們?cè)趯?shí)現(xiàn)更優(yōu)存儲(chǔ)和計(jì)算能效的同時(shí),推進(jìn)我們?cè)谵D(zhuǎn)化醫(yī)學(xué)領(lǐng)域的探索和實(shí)踐?!?/p>
值得一提的是ASTRA于2021年11月打入了全球IO-500榜單,位列10節(jié)點(diǎn)榜單第8名、總榜單第14名;而在今年最新一期的IO-500榜單上,ASTRA位列10節(jié)點(diǎn)榜單第12名、總榜單第19名。排名的小小變化足以證明高性能計(jì)算產(chǎn)業(yè)界在沖擊存儲(chǔ)性能方面的熱衷,但也證明了該平臺(tái)的領(lǐng)先地位——憑借讀寫(xiě)性能達(dá)到102.35GiB/s和97.88GiB/s,極端場(chǎng)景下讀寫(xiě)性能達(dá)到81.57GiB/s和71.71GiB/s的成績(jī),它不但遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)存儲(chǔ)架構(gòu)的表現(xiàn),也是中國(guó)乃至全球范圍內(nèi)生信領(lǐng)域中存儲(chǔ)性能的佼佼者。
在實(shí)際業(yè)務(wù)中,該平臺(tái)自投入以來(lái),也使國(guó)家轉(zhuǎn)化醫(yī)學(xué)中心數(shù)據(jù)處理效率得到了顯著提升。以基因組測(cè)序?yàn)槔?,以往做面?duì)超高深度腫瘤的全基因組測(cè)序這種超大數(shù)據(jù)的處理時(shí),可能需要7天左右,但現(xiàn)在已被壓縮到了8小時(shí)以內(nèi),是以往效率的21倍?!坝?jì)算耗時(shí)大幅縮短,讓醫(yī)生可以更早得到檢測(cè)信息、分析結(jié)果,從而更早提供更有針對(duì)性的診療方案和挽救更多生命,這就是我們?yōu)閷?shí)現(xiàn)個(gè)性化醫(yī)療及精準(zhǔn)醫(yī)學(xué)而做出的努力”,呂綱表示。
隨著科技的發(fā)展,越來(lái)越多的醫(yī)學(xué)診斷都需要高性能計(jì)算的支持,需要對(duì)于數(shù)據(jù)的密集處理和高效分析,由此也引發(fā)了跨界融合的數(shù)字化醫(yī)療應(yīng)用新趨勢(shì)。對(duì)于國(guó)家轉(zhuǎn)化醫(yī)學(xué)中心來(lái)說(shuō),急需將強(qiáng)勁算力、海量數(shù)據(jù)與自身專業(yè)醫(yī)療經(jīng)驗(yàn)相結(jié)合,更好地服務(wù)于患者。
就像呂綱說(shuō)的:“英特爾的技術(shù)實(shí)力和我們生信領(lǐng)域?qū)<业膶I(yè)能力可以比較好地整合在一起,使我們這個(gè)平臺(tái)成為生信領(lǐng)域第一個(gè)能夠在存儲(chǔ)上有所突破的平臺(tái)?!?/p>
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 雷軍說(shuō)破了3999元的心魔,然而蘋(píng)果就如一座大山在頭上壓著
- 中國(guó)不買(mǎi)了,三大光刻機(jī)企業(yè)都降低預(yù)期,后悔莫及
- 東軟解決方案論壇2024在武漢開(kāi)幕 東軟發(fā)布多款創(chuàng)新型解決方案
- 收入首超特斯拉,比亞迪市值為何只有六分之一?
- 永洪科技:點(diǎn)亮數(shù)據(jù)分析之光,成就數(shù)據(jù)價(jià)值之夢(mèng)
- 明星為何爭(zhēng)做探店頂流?
- 小米80多萬(wàn)元的車(chē)值嗎?為誰(shuí)造?
- 江湖老劉:胖東來(lái)為何備受追捧
- 臺(tái)積電更強(qiáng)了,漲價(jià)一成收割美國(guó)芯片
- 雙十一期間大連海參為何受歡迎
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。