當(dāng)AI開始尋找抗生素:人類終于摘取“高懸的果實”?

原標(biāo)題:當(dāng)AI開始尋找抗生素:人類終于摘取“高懸的果實”?

抗生素帶給人類的福澤,無論給出多少溢美之詞都不過分??股卦趹?yīng)用初期,被人們認為是幾乎“包治百病”的靈丹妙藥,成為20世紀(jì)人類最偉大的成就之一。

(圖題:感謝青霉素,給我回家路)

然而到了今天,全球每年約有50%的抗生素被濫用,在中國這一比例甚至接近80%。家有兒女的人們恐怕更有切身體驗,只要孩子頭疼腦熱總要上醫(yī)院打點滴,大多里面都使用了抗生素。人們對于“見效快”的執(zhí)念所造成的直接后果就是讓細菌更具抗藥性,可能以往發(fā)揮作用的抗生素,會因為細菌抗藥性的增加而失效。

對于抗生素寄予厚望的普通人可以會想:科學(xué)家只要找到比產(chǎn)生抗藥性細菌的更強的抗生素就可以了。事實上科學(xué)家們確實是這么干,但抗生素的研究遠非人們想象中那么簡單。

那對更心急、更癡迷“銀彈思維”的吃瓜群眾來說,總是還想打破砂鍋地問一句:有沒有可能找到一種有效消滅大量有害細菌的抗生素呢?從生物規(guī)律上來講,這有點癡心妄想。但目標(biāo)總是要有的,萬一接近了呢?

求瓜得瓜。2月20日,全球著名的自然科學(xué)類期刊《細胞》(Cell)發(fā)表了一篇題為“一種發(fā)現(xiàn)抗生素的深度學(xué)習(xí)方法”的研究論文,報道了麻省理工學(xué)院(MIT)的研究團隊利用深度學(xué)習(xí)模型發(fā)現(xiàn)了一種超強抗生素——Halicin。經(jīng)試驗研究,這種新型抗生素化合物對多種耐藥菌有殺菌效果,具有廣譜抗菌效應(yīng)。當(dāng)然這一研究的亮點在于新的研究方法,即通過AI的深度學(xué)習(xí)算法從大型合成化學(xué)分子庫中找到了這一獨特的分子結(jié)構(gòu)。

AI在藥物研發(fā)上面的能力已經(jīng)不是什么稀罕事,但發(fā)現(xiàn)抗生素還是第一次。好奇心一定會驅(qū)使我們繼續(xù)追問下去:為什么人類研發(fā)抗生素的速度抵不過細菌抗藥性的增長速度?AI開拓出抗生素研發(fā)的路徑對于醫(yī)學(xué)來說又意味著什么?

抗生素發(fā)現(xiàn)的謎題,為什么人類的路越走越窄?

從1928年,弗萊明發(fā)現(xiàn)第一種抗生素——青霉素起幾十年間,此后科學(xué)家們又陸續(xù)發(fā)現(xiàn)了100多種抗生素。但從1987年起一直到2015年,整整28年間,人類卻再也沒有發(fā)現(xiàn)新的抗生素。

為什么新型抗生素的發(fā)現(xiàn)越來越慢,甚至出現(xiàn)了如此長的一段空檔期?可以說,我們目前所使用的主要的幾種抗生素都是四五十年代發(fā)現(xiàn),且都是從土壤中的微生物種群中篩選和培養(yǎng)。大約99%的細菌種群之前是無法在實驗室中單獨培養(yǎng),這一限制條件讓人們無法單獨分離出細菌生產(chǎn)的潛在的有效的抗生化合物。

從上世紀(jì)60年代以后,從微生物種群中尋找新的抗生素的速度明顯放緩,取而代之的是“半合成抗生素”。如今以青霉素、頭孢菌素為主體的β一內(nèi)酰胺類抗生素,已經(jīng)成為最主要的化學(xué)治療藥劑。

一直到2015年,美國科學(xué)家才發(fā)現(xiàn)了一種新型抗生素——泰斯巴汀(Teixobactin)。這一抗生素實現(xiàn)了抗菌藥物領(lǐng)域的一大突破,可以殺死多種致命病原體,同時病原體很難對其發(fā)展出抗藥性。這一科學(xué)進展得益于細菌培育技術(shù)的進步。研究人員通過一種稱為iChip的電子芯片設(shè)備,可以將目標(biāo)細菌分離并分別在比實驗室更自然的土壤環(huán)境中生長,從而讓只有1%成長機會的細菌提升到50%。

盡管如此,發(fā)現(xiàn)新的抗生素的效率仍然還是太低了,而且經(jīng)過大規(guī)模投入培養(yǎng)出的抗生素很可能還是舊的抗生素,或者不具有很好的抗菌活性。那這次為什么AI就能做到呢?

窺斑見豹:新型抗生素探尋的AI新路徑

由于傳統(tǒng)的抗生素藥物培育的低效,從大型合成化學(xué)文庫的篩選抗生素分子結(jié)構(gòu)成為一種新思路。但這些文庫可能包含幾十萬到幾百萬個化學(xué)分子,但分子式的化學(xué)多樣性有限,且無法反映抗生素分子可能的化學(xué)性質(zhì)。一來是人工篩選的工作量極大成本過高,再則是面臨難以驗證化合物多樣性的限制。

從分子庫中篩選對某種細菌能夠產(chǎn)生抑制性的分子,再去驗證這些分子與已經(jīng)應(yīng)用的抗生素的差異。其中包括了海量的計算與重復(fù)實驗,讓這一辦法對于人類研究者確實太不友好了。

但這次,AI作為一種新的研究手段引入對這些合成化學(xué)分子的篩查,讓發(fā)現(xiàn)抗生素引來重大轉(zhuǎn)機。研究人員提出了將結(jié)構(gòu)分析和篩選相結(jié)合的思路,利用機器學(xué)習(xí)算法從分子性質(zhì)中預(yù)測具有潛在抗菌性能的化合物。這一次大獲成功。

首先,研究者以抑制某種大腸桿菌為目標(biāo)進行篩選,選取了2335種FDA已經(jīng)批準(zhǔn)的藥物分子或自然化合物分子,再以80%生長抑制率為標(biāo)準(zhǔn),將它們分為有抑菌性和沒有抑菌性兩類,作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集。

同時,他們采用了一種“有向消息傳遞深度神經(jīng)網(wǎng)絡(luò)”(DMP-DNN)的算法,將化合物的原子和成鍵等信息以連續(xù)向量的方式多次重復(fù)傳遞,從而獲取更高級的表征結(jié)果。這一神經(jīng)網(wǎng)絡(luò)是通過自學(xué)習(xí)向量來表征分子,而不需要人為標(biāo)注特定的分子結(jié)構(gòu)。

有向信息傳遞網(wǎng)絡(luò)能直接從分子的圖結(jié)構(gòu)預(yù)測分子的屬性,經(jīng)過固定次數(shù)的信息傳遞步驟,最終形成的分子的單個向量就可以進行對細菌的抑制率的預(yù)測。這種窺斑見豹的方式,大大的縮短了篩選路徑,也降低了對于算力、時間等等成本的消耗。

(除了銅綠假單胞菌(底部藍色)外,Halicin在幾種耐藥菌測試中,顯示了良好的廣譜抗菌活性)

隨后,將訓(xùn)練過的深度學(xué)習(xí)模型應(yīng)用到博德研究所的包含約1億分子量的DRH化合物庫中進行篩選,該模型從6111個正處于研究階段的藥物分子里,選出了99種最有可能存在抑菌性的化合物。

最后,經(jīng)過實驗結(jié)果證實,其中的51種能明顯抑制該類大腸桿菌生長。從中選出了這種被命名為Halicin的化合物,因其低體內(nèi)毒性和結(jié)構(gòu)新穎性,成為最有潛力的新型抗生素。

此后研究者將在再次訓(xùn)練過的深度學(xué)習(xí)模型應(yīng)用在了規(guī)模更大的ZINC15藥物小分子數(shù)據(jù)庫上,對約一億化合物的預(yù)測和篩選,又發(fā)現(xiàn)了新的潛在的抗生素結(jié)構(gòu)。而這一篩選過程,也僅僅只用了三天。

可見在深度學(xué)習(xí)的幫助下,6111個藥物分子被篩選成99個,對這99個藥物分子再進行試驗,效率自然快得多。

這一開創(chuàng)性研究標(biāo)志著抗生素發(fā)現(xiàn)乃至更普遍的新藥挖掘方法發(fā)生了范式轉(zhuǎn)變。那AI的加入到底會帶來哪些更多的價值呢?

抗生素新藥研發(fā)的戰(zhàn)場,AI正全軍出擊

一般來說,傳統(tǒng)的藥物的研發(fā)主要經(jīng)歷這四個階段:

1、靶點的選擇和確認;2、先導(dǎo)化合物的發(fā)現(xiàn)和優(yōu)化;3、臨床前研究;4、臨床試驗。之后才可以正式被批準(zhǔn)上市。一款新藥從研發(fā)到上市面臨3個“10”的考驗:10年時間、10億美金、10%成功率,而且這一趨勢更為嚴(yán)重。對于抗生素的研發(fā),也面臨著同樣的長時間高投入、低產(chǎn)出低利潤的問題。

在AI特別是深度學(xué)習(xí)算法的幫助下,藥物研發(fā)正在迎來新的轉(zhuǎn)機。從目前AI已經(jīng)在投入應(yīng)用的新藥研制,以及這一次AI在新的抗生素化合物分子的發(fā)現(xiàn)上,都表現(xiàn)出非常明顯的效果??梢哉f,未來AI在新藥物挖掘、化合物篩選、靶點發(fā)現(xiàn)和藥物有效性預(yù)測等方面都將起到極大的輔助作用,一定程度上提高研發(fā)效率、節(jié)約資金以及降低臨床試驗的失敗風(fēng)險。

現(xiàn)代藥物研發(fā)首先最關(guān)鍵的就是藥物標(biāo)靶的尋找和識別。藥物靶點是指藥物在體內(nèi)的作用結(jié)合位點,包括基因位點、受體、酶、離子通道、核酸等生物大分子。選擇確定新穎的有效藥靶是新藥開發(fā)的首要任務(wù)。引入AI技術(shù)之前,傳統(tǒng)抗生素作用新靶點的篩查基于基因組、抑制蛋白質(zhì)合成、合成酶等方法,其困難在于人工篩選試驗效率低下,進展緩慢。而通過AI的深度學(xué)習(xí)模型的介入,可以更快地數(shù)以千萬計的科學(xué)文獻的非結(jié)構(gòu)數(shù)據(jù)以及這些生物的基因分子中找到可能合適的靶點。再通過選擇不同的靶點并進行驗證,以了解靶點的生物學(xué)特性,實時交互得到有證據(jù)的結(jié)果,實現(xiàn)相應(yīng)藥物靶點的發(fā)現(xiàn)。

再則,AI在新藥物的化合物篩選上面也同樣高效而準(zhǔn)確。此次Halicin這一高活性化合物發(fā)現(xiàn),正是根據(jù)具體的藥物靶向需求,采用靈活的模型算法,在數(shù)千種可能的分子合成物中有效篩選可能的藥物分子結(jié)構(gòu),極大節(jié)省了篩選時間和成本。

另外,除了在新藥物靶點發(fā)現(xiàn)以及高活性化合物的發(fā)現(xiàn)外,AI在小分子藥物自動合成路線的設(shè)計、新藥物效果模擬和預(yù)測,甚至新型藥物分子的預(yù)測上面都有實際應(yīng)用的實踐。這對于無論是抗生素藥,還是更普遍的藥物的研發(fā)都將帶來巨大的契機。

在新藥研發(fā)領(lǐng)域有一個形象的說法,那些“低垂的果實“都已經(jīng)被摘完了,未來的新藥研發(fā)需要去被茂密的樹枝和樹葉阻擋的果樹高處去摘取果實。而AI可能正是抵達這些樹枝身處摘取果實的最好階梯。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-03-09
當(dāng)AI開始尋找抗生素:人類終于摘取“高懸的果實”?
那對更心急、更癡迷“銀彈思維”的吃瓜群眾來說,總是還想打破砂鍋地問一句:有沒有可能找到一種有效消滅大量有害細菌的抗生素呢?當(dāng)然這一研究的亮點在于新的研究方法,即通過AI的深度學(xué)習(xí)算法從大型合成化學(xué)分子

長按掃碼 閱讀全文