聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

面對當(dāng)前新型冠狀病毒(2019-nCoV)感染肺炎不斷擴散的嚴(yán)峻形勢,華為云EI醫(yī)療智能體團(tuán)隊聯(lián)合華中科技大學(xué)同濟(jì)醫(yī)學(xué)院基礎(chǔ)醫(yī)學(xué)院李巖教授,西安交通大學(xué)第一附屬醫(yī)院劉冰教授,中科院北京基因組研究所韓大力研究員,華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬武漢兒童醫(yī)院柯尊輝大夫組成聯(lián)合攻關(guān)團(tuán)隊,針對新型冠狀病毒(2019-nCoV)的多個靶標(biāo)蛋白進(jìn)行了超大規(guī)模計算機輔助藥物篩選工作。篩選出五種可能對2019新型冠狀病毒(2019-nCoV)有效的抗病毒藥物(新聞鏈接:https://www.huaweicloud.com/news/2020/20200204113312294.html)。現(xiàn)將聯(lián)合科研團(tuán)隊對2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布。

  背景介紹

  蛋白質(zhì)同源建模

蛋白質(zhì)同源建模是指當(dāng)未知結(jié)構(gòu)的蛋白和已知結(jié)構(gòu)的蛋白質(zhì)在一級序列上比較相似的時候,可以把已知結(jié)構(gòu)的蛋白作為模板,通過計算機的模擬和計算,基于未知結(jié)構(gòu)蛋白的一級序列預(yù)測其三維空間結(jié)構(gòu)。

同源建?;趦蓚€假設(shè):1. 蛋白質(zhì)的結(jié)構(gòu)由其氨基酸序列唯一決定,如果已經(jīng)知道一級序列,在理論上就可以獲取其二級結(jié)構(gòu)以及三級結(jié)構(gòu)。2. 蛋白質(zhì)的三級結(jié)構(gòu)在進(jìn)化中相比于其一級序列更加保守。如果兩個蛋白質(zhì)的氨基酸序列有50%相同,那么約有90%的a-碳原子的位置偏差不超過3 Å。

以SARS-CoV蛋白質(zhì)結(jié)構(gòu)作為模板構(gòu)建2019-nCoV蛋白質(zhì)三維結(jié)構(gòu)

2019-nCoV和SARS-CoV非常近似,氨基酸的序列一致性達(dá)到了76.47%。同時SARS-COV的蛋白質(zhì)的三維結(jié)構(gòu)基本上已經(jīng)被解析出來,所以我們可通過這些已知的蛋白質(zhì)三維結(jié)構(gòu)作為模板,構(gòu)建2019-nCoV的蛋白質(zhì)結(jié)構(gòu),并進(jìn)而指導(dǎo)藥物研發(fā)。

  數(shù)據(jù)和方法

  2019-nCoV蛋白質(zhì)一級序列提取

2019-nCoV的基因組序列參考NCBI上已公開的序列:NC_045512.2。由于基因組注釋數(shù)據(jù)的缺失,無法直接獲取其所有功能蛋白質(zhì)的一級序列。因此我們將SARS-CoV的各個蛋白對應(yīng)的序列比對到2019-nCoV基因組上,選擇best match的比對區(qū)域,作為該蛋白對應(yīng)的在2019-nCoV的一級序列。通過這種方法,我們獲得了2019-nCoV的共計20個蛋白質(zhì)的序列,其中包含非結(jié)構(gòu)蛋白16個(NSP1-16),結(jié)構(gòu)蛋白4個(S,M,N,E)。

  同源建模

  Swiss model用于同源建模

Swiss-model是自動化蛋白質(zhì)同源建模工具,使用的過程中需要用戶輸入目的蛋白的序列,也可以同時指定參考蛋白質(zhì)模板,在沒有指定模板的情況下,系統(tǒng)會自動選擇匹配度最高的模板。

我們在通過Swiss-model做同源建模的步驟和結(jié)果如下:

  Step 1: 輸入蛋白質(zhì)序列

在swiss-model主頁 (https://swissmodel.expasy.org/) 點擊“Start modeling”并上傳蛋白質(zhì)的fasta序列。點擊“Search For Templates”,開始搜索最模板蛋白。

聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

  Step 2: 選擇合適的模板蛋白

Swiss-model會給出通過一級序列匹配到的模板蛋白,以及每一個模板蛋白的匹配度和模板蛋白的參數(shù),通過以下標(biāo)準(zhǔn),我們選擇最優(yōu)的模板蛋白用于同源建模:

1. 目的蛋白和模板蛋白一級序列一致性要求:identity>30%;優(yōu)先選擇identity最高的模板蛋白;

2. 優(yōu)先選擇SARS-COV的模板蛋白用于同源建模;

3. 當(dāng)identity比較相似的時候,優(yōu)先選擇通過高精度X-ray方法構(gòu)建晶體結(jié)構(gòu)的模板;如果沒有X-ray,需要點進(jìn)PDB看蛋白結(jié)構(gòu)分辨率,優(yōu)先選分辨率高的;

4. 如果Oligo State存在有Homo和heter,就兩個都要選擇。

聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

  Step 3:同源建模

選定好最優(yōu)的模板蛋白之后,點擊頁面的“Build Models”,即可自動的做同源建模;對于序列比較短的蛋白(<100 殘基),該過程通?;ㄙM幾分鐘;對于序列比較長的蛋白(>1000 殘基),該過程通?;ㄙM約二十分鐘左右; 建模完成后,可直接下載模板蛋白和目的蛋白的三維空間結(jié)構(gòu)用于后續(xù)的分析。

聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

  Step 4:分子動力學(xué)模擬

同源建模得到的蛋白質(zhì)結(jié)構(gòu)可以用于分子動力學(xué)(Molecular Dynamics)模擬。分子動力學(xué)模擬可以通過GROMACS等工具完成,這一步驟通常比較耗時。華為云醫(yī)療智能體平臺已經(jīng)提供加速版的GROMACS,加速后的GROMACS消耗的時間僅有傳統(tǒng)版本的1/6。

聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

  結(jié)果

  建模結(jié)果統(tǒng)計

針對2019-nCOV的20個蛋白質(zhì)一級序列,有15個蛋白和SARS-COV的蛋白質(zhì)有比較高的同源性,identity>70%;通過蛋白質(zhì)三維工具可視化之后,也可以看到這些蛋白質(zhì)的三維空間構(gòu)象和模板蛋白比較相似;

其中有一個蛋白質(zhì),NSP4,在SARS-COV中沒有很好的同源蛋白,是以小鼠肝炎病毒的A59進(jìn)行建模,其identity>60%;

另外有四個蛋白質(zhì)的同源建模效果不是很好,其中NSP2,NSP6和M均沒有很好的目的模板,匹配度最好的蛋白質(zhì)序列的identity < 30%;所以建模的結(jié)果不太理想;同時NSP11蛋白質(zhì)的長度只有11個殘基,長度太短,不滿足建模要求;

目的蛋白的長度,模板蛋白的選擇和同源建模的參數(shù)整理在以下的表格中供參考:

聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

  數(shù)據(jù)和可視化

模板蛋白和同源建模得到的2019-nCoV蛋白質(zhì)三維結(jié)構(gòu)都以PDB格式進(jìn)行保存,為了方便用戶查閱,華為云醫(yī)療智能體平臺的Notebook工具已經(jīng)內(nèi)置了可視化所需要的插件和工具,用戶可以交互式拖動和展示感興趣的蛋白質(zhì)三維結(jié)構(gòu)。

聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布

以上涉及到的數(shù)據(jù)、算法和工具都已經(jīng)集成在華為云醫(yī)療智能體平臺,基于華為云AI昇騰集群服務(wù)的強大算力,用戶可省時省力地完成端到端的分析。

  相關(guān)鏈接

• 醫(yī)療智能體官網(wǎng)

• 抗疫進(jìn)展:華為云聯(lián)合多家科研機構(gòu)篩選出五種可能有效的抗病毒藥物

AI助力“抗疫”,超大規(guī)模計算機輔助藥物篩選技術(shù)解讀

• 2019新型冠狀病毒計算機輔助大規(guī)模藥物篩選結(jié)果(Mpro蛋白)

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-02-07
聯(lián)合科研團(tuán)隊:2019新型冠狀病毒所有關(guān)鍵蛋白質(zhì)同源模建結(jié)果和方法公布
面對當(dāng)前新型冠狀病毒(2019-nCoV)感染肺炎不斷擴散的嚴(yán)峻形勢,華為云EI醫(yī)療智能體團(tuán)隊聯(lián)合華中科技大學(xué)同濟(jì)醫(yī)學(xué)院基礎(chǔ)醫(yī)學(xué)院李巖教授,西安交通大學(xué)第一附屬

長按掃碼 閱讀全文