基因探秘:HPC創(chuàng)新是基因測序普惠萬眾的捷徑

著名未來學家?guī)炱濏f爾在《奇點臨近》中,預(yù)言在2045年隨著基因、納米和機器人三大技術(shù)實現(xiàn)革命性突破,技術(shù)力量會以指數(shù)規(guī)律快速發(fā)展,人類亙古追求的“永生”將有望變?yōu)楝F(xiàn)實,而基因技術(shù)則是這一切的基礎(chǔ)之一。

原來做一次完整的基因測序在幾年前需要數(shù)萬美金,但現(xiàn)在一套基因測序只需要一千美金左右,那么未來基因測序在價格上還有多大的讓利空間?一套完整的基因測序動輒會產(chǎn)生數(shù)GB基本的龐大數(shù)據(jù),在后期分析這些基因樣本時需要怎樣的計算力去做支撐?現(xiàn)在做基因檢測大概要等一周甚至更長的時間,那么未來有沒有可能像做血液檢查一樣,可以在數(shù)小時內(nèi)就得到檢測結(jié)果?


基因探秘:HPC創(chuàng)新是基因測序普惠萬眾的捷徑


在2018年聯(lián)想全球智慧超算峰會的生命科學圓桌會議上,帶著以上諸多問題我們采訪了諾禾致源副總裁吳俊和聯(lián)想數(shù)據(jù)中心業(yè)務(wù)集團制造行業(yè)總監(jiān)許子牛,在他們的解答中,我們可以看出超算已經(jīng)成為了基因技術(shù)進一步發(fā)展的重要推力。

基因測序行業(yè)再次印證“螺旋加速定律”

有人曾把基因堿基鏈,比作破解生命密碼的終極鑰匙。其實現(xiàn)在基因檢測已經(jīng)不再是陽春白雪般的存在,利用基因測序技術(shù),可以對孕婦進行無創(chuàng)傷的產(chǎn)前先天遺傳缺陷檢測,也可以通過檢測腫瘤基因特征片段提早預(yù)防癌癥,還可以通過基因技術(shù)來尋找最優(yōu)的藥物治療方案?;蚣夹g(shù)已經(jīng)被公認是,有可能改變?nèi)祟惷\的關(guān)鍵技術(shù)。


基因探秘:HPC創(chuàng)新是基因測序普惠萬眾的捷徑


基因技術(shù)站在了自然科學的風口,而諾禾致源則站在了基因行業(yè)的風口之上。據(jù)吳俊介紹,諾禾致源的業(yè)務(wù)覆蓋科技服務(wù)、腫瘤基因檢測及遺傳檢測三大領(lǐng)域,為全球研究型大學、科研院所、醫(yī)院、醫(yī)藥研發(fā)企業(yè)、農(nóng)業(yè)企業(yè)等提供基因測序、質(zhì)譜分析和生物信息技術(shù)支持等服務(wù)。其中科研服務(wù)的內(nèi)容是為大專院校、醫(yī)院、藥企提供測序的服務(wù),從測序到后續(xù)的數(shù)據(jù)分析,最后給到客戶分析報告,客戶根據(jù)相應(yīng)的實驗設(shè)計挖掘出數(shù)據(jù)具體的生物學意義。目前諾禾致源已在全球運行25臺NovaSeq、20臺PacBio Sequel、30臺HiSeq X、11臺HiSeq 2000/2500/4000、4臺MiSeq、4臺NextSeq 500、6臺Life Ion Proton(DA8600)、2臺S5XL和5套Q Exactive HF-X等最先進的基因測序儀,建立了亞洲通量規(guī)模最大的基因測序平臺,將實現(xiàn)每年280,000人全基因組測序的超高通量。

在半導(dǎo)體產(chǎn)業(yè)有著名的摩爾定律,而基因測序技術(shù)的技術(shù)更新甚至超越了半導(dǎo)體發(fā)展的速度。有相關(guān)統(tǒng)計數(shù)據(jù)顯示,2007年全球基因測序市場規(guī)模僅為800萬美元,而到2018年全球基因測序市場規(guī)模將有望達到117億美元,這是典型的指數(shù)級增長實例,也是高新技術(shù)常出現(xiàn)的性能飛速提升、價格快速下降、用戶規(guī)模幾何級數(shù)增長的“螺旋加速定律”的鮮活案例。

吳俊在采訪中表示,在幾年前測一個人的基因組需要一萬美金,現(xiàn)在大概只需要一千美金,整體的測序成本降速是非??斓?,相比于半導(dǎo)體產(chǎn)業(yè)著名的摩爾定律,整個基因測序產(chǎn)業(yè)的成本降幅速度甚至超過了摩爾定律的。這就面臨一個亟待解決的現(xiàn)實問題,在基因測序成本降得迅速、測序樣本數(shù)量又在快速增大的前提下,找到能滿足基因測序行業(yè)特定需求的HPC解決方案就成為必須解決的問題。

基因測序應(yīng)對爆發(fā)性成長,需要HPC有新突破

據(jù)吳俊介紹,基因測序行業(yè)因為自身的業(yè)務(wù)特性,所以對HPC的選擇上有鮮明的行業(yè)特征要求:

第一,要滿足大數(shù)據(jù)量需求?;驕y序產(chǎn)生的數(shù)據(jù)量都是TB級別,以諾禾致源為例,每臺測序機器一天產(chǎn)生的數(shù)據(jù)量是6TB,按照目前60臺測序機器產(chǎn)生的數(shù)據(jù)量,2018年產(chǎn)生的數(shù)據(jù)量將達到30PB,這就必須要求HPC系統(tǒng)具有海量數(shù)據(jù)存儲能力。

第二,對內(nèi)存需求量大。在后期基因序列分析時,往往會進行序列對比,這就要求要將海量數(shù)據(jù)一次性的載入到內(nèi)存并加以處理,而不適宜分批導(dǎo)入,這就對內(nèi)存有了非常嚴苛的容量要求。

第三,對計算力要求高。根據(jù)實際測試,目前基因測序所用的專用軟件,用GPU來跑還不夠成熟和穩(wěn)定,所以對CPU的性能要求就變得更高。

經(jīng)過縝密的選型,最終諾禾致源選擇了聯(lián)想HPC。據(jù)了解,聯(lián)想提供的刀片是高性能運算系統(tǒng),配置超過10PB的存儲空間,單節(jié)點配置了最高達2TB的超大容量內(nèi)存。并且通過統(tǒng)一的集群監(jiān)控管理、作業(yè)調(diào)度,不單保證了整套系統(tǒng)的穩(wěn)定性,而且還可以利用調(diào)優(yōu)來不斷釋放系統(tǒng)的計算潛力。經(jīng)過改造升級,如今諾禾致源已經(jīng)擁有全球領(lǐng)先的高性能計算平臺,數(shù)據(jù)中心運算能力已提升至1727T flops,總內(nèi)存410TB,總存儲60.2PB,有效地支撐著生命科學研究和醫(yī)療健康兩大領(lǐng)域?qū)Υ髷?shù)據(jù)分析和存儲的需求。

吳俊在采訪時表示,在不考慮成本、投入巨量算力的前提下,現(xiàn)在基因測序的后期數(shù)據(jù)處理周期可以從2.5天縮短到20分鐘,所以諾禾致源對HPC的算力提升有殷切的期待,尤其是當E級計算實現(xiàn)之后,軟件不斷會針對GPU加速和多核調(diào)優(yōu),那么做一次基因測序后期比對的時間縮短到一個小時內(nèi)是可以期待的。


基因探秘:HPC創(chuàng)新是基因測序普惠萬眾的捷徑


許子牛在接受采訪時表示,聯(lián)想作為計算工具提供商來說,當提供的工具越好、商業(yè)化程度越高,對客戶來說采購風險就會越低。未來基因測序需求大爆炸,會對HPC有更多要求,聯(lián)想認為HPC跟普通的個人計算機不同,它往往擔負著核心業(yè)務(wù)或者尖端科研計算的重任,所以單純?nèi)フ凥PC的價格沒有意義,而是應(yīng)該考量HPC在整個生命周期的成本。就比如,現(xiàn)在基因測序的數(shù)據(jù)中心不像傳統(tǒng)IDC的數(shù)據(jù)中心,可以建在像內(nèi)蒙古等能源豐富的地方,而更多地建在重點中心城市,這就對單位能耗、對節(jié)能有更高的要求,所以聯(lián)想的重點會放在切實降低用戶整體成本上。其實對于一個HPC數(shù)據(jù)中心而言,峰值計算能力有多高僅僅在設(shè)計和驗收時有意義,更多時候是考驗HPC的穩(wěn)定性和耐久性,聯(lián)想計算團隊在后期維護和技術(shù)保障上有口皆碑,會幫助用戶不斷調(diào)優(yōu),從而能讓用戶以經(jīng)濟的投入獲得更高的算力回報,聯(lián)想認為這才是能給用戶帶來持久價值的選擇。

HPC不只是巔峰算力,還決定人類探索未知的新邊界

在過去,人類是用雙腳丈量世界,但在探索太空的過程中,人類可以利用射電望遠鏡、HPC來探測更遙遠的太空奧秘。讓我們引以為傲的“神舟十一號”載人航天工程中,聯(lián)想HPC提供了強大的技術(shù)保障。尤其是在軌道計算、模擬仿真、航天器設(shè)計等關(guān)鍵事件中,承擔了大量重要的計算工作,穩(wěn)定可靠的品質(zhì)完美匹配“航天級”苛刻要求,大量節(jié)省了實驗經(jīng)費,大大縮短了計算周期,提高了航天器設(shè)計的可靠性。

過去監(jiān)測海洋環(huán)境主要依靠依靠人工采樣,不但耗時費力,而且時效性也不佳。而利用HPC和遙感技術(shù),則可以實時動態(tài)地對海洋環(huán)境進行監(jiān)測。聯(lián)想為國家海洋局搭建的高效海洋環(huán)境監(jiān)測預(yù)警高性能平臺,大幅提高了監(jiān)測數(shù)據(jù)的計算、分析、處理功能,充分滿足了國家海洋局的科研需求。


基因探秘:HPC創(chuàng)新是基因測序普惠萬眾的捷徑

聯(lián)想聯(lián)想集團高級副總裁、數(shù)據(jù)中心業(yè)務(wù)集團中國區(qū)總裁童夫堯在做主題演講時表示,在前不久剛剛結(jié)束的世界超算大會(ISC2018)上,聯(lián)想憑借117套入圍的成績,成為HPC TOP500榜單中全球最大的HPC解決方案供應(yīng)商。作為首家獲此殊榮的中國廠商,聯(lián)想正在以“科技創(chuàng)新”賦能行業(yè)變革,為科研、教育、航天、氣象、汽車、石油石化、生命科學等多個領(lǐng)域提供領(lǐng)先成熟的解決方案。

基因探秘:HPC創(chuàng)新是基因測序普惠萬眾的捷徑

正如國防科大計算機學院院長廖湘科所言,擁抱新技術(shù)是HPC繼續(xù)輝煌的必由之路,未來的智慧超算時代,必然離不開HPC、大數(shù)據(jù)與人工智能的融合創(chuàng)新。在峰會當天,聯(lián)想發(fā)布了自主研發(fā)的AI產(chǎn)品家族,其中包括專為HPC和AI優(yōu)化的全新人工智能服務(wù)器ThinkSystemSR670、Think SystemHG680、ThinkSystemHG690;全新的LiCO GENE Edition;此外,聯(lián)想還推出第三代溫水水冷解決方案“海王星”系統(tǒng),走在了HPC與AI融合創(chuàng)新的行業(yè)潮頭。

人類被稱為萬物之靈長,與動物最大的區(qū)別,就在于人類能夠利用和發(fā)明工具。人類在陸續(xù)發(fā)明蒸汽機、電動機、計算機和互聯(lián)網(wǎng)等重要發(fā)明之后,人類改造世界的能力在不斷增強。從某種程度上來說,HPC現(xiàn)在代表的已經(jīng)不只是人類的巔峰計算力,而是人類探索未知世界的新邊界。我們也衷心期待聯(lián)想為代表的中國HPC力量,在不久的將來能夠第一個實現(xiàn)E級計算的歷史性突破,中國HPC產(chǎn)業(yè)能夠在硬件、軟件、應(yīng)用等方面不斷成熟,從而建立起更加有競爭力的智慧超算新生態(tài),也讓HPC成為中國未來科技發(fā)展和融合創(chuàng)新的基石。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-09-07
基因探秘:HPC創(chuàng)新是基因測序普惠萬眾的捷徑
技術(shù)力量會以指數(shù)規(guī)律快速發(fā)展,人類亙古追求的“永生”將有望變?yōu)楝F(xiàn)實,而基因技術(shù)則是這一切的基礎(chǔ)之一。

長按掃碼 閱讀全文