深度學(xué)習(xí)給生物學(xué)帶來了哪些改變?(上)

高層速讀

關(guān)鍵信息:生物學(xué)研究人員正在使用深度學(xué)習(xí)算法對細胞圖像進行分類、建立基因組聯(lián)系、推進藥物發(fā)現(xiàn)…從基因組學(xué)、成像到電子病歷均有深度學(xué)習(xí)的應(yīng)用。

人工智能作為一種流行的科技,為生物數(shù)據(jù)的測量和分類提供了強有力的幫助,但是對于那些對人工智能不熟悉的人來說,這項技術(shù)是困難的。

谷歌團隊與神經(jīng)學(xué)家的合作

四年前,谷歌的科學(xué)家們出現(xiàn)在了神經(jīng)學(xué)家 Steve Finkbeiner的家門口,這些科學(xué)家是位于加州山景城的谷歌加速科學(xué)研究部門的人員,該部門的目標是利用谷歌人工智能技術(shù)來加速科學(xué)發(fā)展,他們有興趣將深度學(xué)習(xí)技術(shù)應(yīng)用于神經(jīng)疾病研究,比如與擁有大量神經(jīng)成像數(shù)據(jù)的Finkbeiner團隊合作。

在神經(jīng)成像數(shù)據(jù)中,深度學(xué)習(xí)算法從一個非常大的、帶注釋的數(shù)據(jù)集(如圖像或基因組集合)中獲取數(shù)據(jù)的原始特征,并利用它們創(chuàng)建一個數(shù)據(jù)預(yù)測模型,一旦經(jīng)過訓(xùn)練,這些算法就可以應(yīng)用這種訓(xùn)練來分析其他數(shù)據(jù)。

Finkbeiner說,這項技術(shù)可以用來解決“真正困難、棘手、復(fù)雜的問題,并能看到數(shù)據(jù)中的結(jié)構(gòu)的不足:數(shù)據(jù)量太大、太復(fù)雜、人腦無法理解等?!?/p>

Finkbeiner和他的團隊使用一種高通量成像策略來獲取數(shù)據(jù),這種策略是他們?yōu)檠芯磕X細胞而開發(fā)的。但團隊的數(shù)據(jù)分析速度卻遠不如獲取速度那樣快,因此Finkbeiner同意了與谷歌團隊的合作。

深度學(xué)習(xí)給生物學(xué)帶來了哪些改變?(上)

在達成合作之后,F(xiàn)inkbeiner坦然地說道:“我當(dāng)時可不能實話實說,雖然我知道深度學(xué)習(xí)可以解決哪些問題,但我也清楚,我們數(shù)據(jù)分析能力只有數(shù)據(jù)獲取能力的一半左右,我們團隊的數(shù)據(jù)分析能力還是比較弱?!?/p>

二者深度學(xué)習(xí)算法初見成效

現(xiàn)在,二者的合作和努力開始收到成效。Finkbeiner的團隊和谷歌的科學(xué)家一起,訓(xùn)練了一套由兩組細胞組成的深度學(xué)習(xí)算法。其中一組是未標記的,另一組是人工標記的,用來表示科學(xué)家通常觀察不到的數(shù)據(jù)特征。

Finkbeiner說,當(dāng)他們后來將該算法運用在未貼標簽的細胞圖像上時,團隊驚訝地發(fā)現(xiàn),“該算法在預(yù)測圖像該貼什么標簽方面非常出色”,并且有一份詳細說明這一工作的刊物即將出版。

Finkbeiner的成功凸顯了人工智能最有希望的分支之一--深度學(xué)習(xí)--正在生物學(xué)領(lǐng)域取得進展,這些算法已經(jīng)滲透到智能手機、智能音箱和自動駕駛汽車等領(lǐng)域中。在生物學(xué)中,深度學(xué)習(xí)算法以人類無法理解的方式深入數(shù)據(jù),檢測到人類可能無法捕捉到的生物特征。

深度學(xué)習(xí)給生物學(xué)帶來了哪些改變?(上)

研究人員正在使用這些算法對細胞圖像進行分類,建立基因組聯(lián)系,推進藥物發(fā)現(xiàn),甚至發(fā)現(xiàn)不同數(shù)據(jù)類型之間的聯(lián)系,從基因組學(xué)、成像到電子病歷領(lǐng)域均有應(yīng)用。

訓(xùn)練智能算法做出預(yù)測

深度學(xué)習(xí)算法是20世紀40年代首次提出的一種計算模型,它依賴于神經(jīng)網(wǎng)絡(luò)。在該模型中,類似神經(jīng)元的節(jié)點層模仿人類大腦分析信息的方式。賓夕法尼亞大學(xué)費城分校的計算生物學(xué)家Casey Greene說,直到五年前,基于神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)算法還依賴于研究人員將原始信息處理成一種更有意義的形式,然后將其輸入計算模型。

深度學(xué)習(xí)給生物學(xué)帶來了哪些改變?(上)

但是,數(shù)據(jù)集規(guī)模的爆炸式增長--比如智能手機快照或大規(guī)?;蚪M測序--以及算法創(chuàng)新等,已經(jīng)使人類的數(shù)據(jù)處理能力后退一步成為可能。機器學(xué)習(xí)的“深度學(xué)習(xí)”這一進步,迫使計算機找到嵌入像素中有意義的關(guān)系。作為神經(jīng)網(wǎng)絡(luò)過濾和信息排序的層,它們還相互通信,允許每一層優(yōu)化前一層的輸出。

最終,這個過程允許一個經(jīng)過訓(xùn)練的算法來分析一幅新的圖像,并能正確地識別它,例如某一個病患的細胞。但是,算法無法再控制分類過程,甚至無法精確解釋軟件正在做什么。盡管這些深度學(xué)習(xí)網(wǎng)絡(luò)在做出預(yù)測方面可以驚人地準確,但finkbeiner說,“有時候要弄清楚網(wǎng)絡(luò)看是因為到了什么才能做出如此準確的預(yù)測仍然是一項挑戰(zhàn)”。

生物學(xué)的其他分支也獲得回報

然而,生物學(xué)的許多分支學(xué)科如成像等,正在從這些預(yù)測中獲得回報。例如,2005年,麻省理工學(xué)院和哈佛大學(xué)的計算生物學(xué)家Anne Carpenter發(fā)布了一個名為Cell Profiler的開源軟件包,以幫助生物學(xué)家定量測量個體特征。例如:顯微鏡領(lǐng)域中熒光細胞的數(shù)量或斑馬魚的長度。

但是深度學(xué)習(xí)可以讓Carpenter的團隊走得更遠。她說:“我們已經(jīng)轉(zhuǎn)向測量生物學(xué)家們沒有意識到的可以用圖像來測量的東西?!庇涗洸⒔Y(jié)合像DNA染色、細胞器紋理和細胞中空空間的質(zhì)量等視覺特征,可以產(chǎn)生數(shù)千個數(shù)據(jù)特征,其中任何一個特征都有可能揭示新發(fā)現(xiàn)。目前版本的Cell Profiler包含了一些深度學(xué)習(xí)的元素,她的團隊希望在明年增加更復(fù)雜的深度學(xué)習(xí)工具。

Carpenter說:“大多數(shù)人都很難做到,但事實上,在一張細胞圖像中存在很多信息,就像對細胞群進行轉(zhuǎn)錄分析時的信息一樣多?!?/p>

深度學(xué)習(xí)給生物學(xué)帶來了哪些改變?(上)

這種處理方式使Carpenter的團隊能夠采取一種監(jiān)管較少的方法,將細胞圖像轉(zhuǎn)換為與疾病相關(guān)的表型。Carpenter還是Recursion制藥公司的科學(xué)顧問,該公司正利用其深度學(xué)習(xí)工具,針對罕見的單基因疾病進行藥物開發(fā)。

微信搜索【AI商業(yè)報道】,獲取最新行業(yè)資訊!

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-03-05
深度學(xué)習(xí)給生物學(xué)帶來了哪些改變?(上)
高層速讀關(guān)鍵信息:生物學(xué)研究人員正在使用深度學(xué)習(xí)算法對細胞圖像進行分類、建立基因組聯(lián)系、推進藥物發(fā)現(xiàn)…

長按掃碼 閱讀全文