如何利用機器學習了解人體免疫系統(tǒng)?

把你的免疫反應看作是一個巨大的機器學習問題,你的身體就是計算機。

免疫細胞在你的身體中移動,對它們接觸到的各種物質(zhì)進行取樣,從你自己的細胞,到絕對不應該存在的有機體細胞。如果免疫細胞遇到的東西不應該是你身體的一部分——例如細菌或病毒——那么身體會出動哪些知道如何對付這些闖入者的細胞。

如果有細胞之前曾經(jīng)見過這個入侵者,知道如何處理它的話,那么你的身體會迅速繁殖這個細胞數(shù)千次——多到足以讓它可以在有時間駐扎到你全身之前壓制住細菌或病毒。一旦入侵者被驅(qū)逐,免疫系統(tǒng)就會再次減少這些細胞的數(shù)量,保持足夠的儲備——萬一細菌卷土重來——有足夠的免疫步兵再次擊潰這些入侵者。

這個過程可以幫助你保持健康,也可能是讓醫(yī)生更早地發(fā)現(xiàn)患者疾病的關(guān)鍵——借助以云計算為動力的人工智能

今年早些時候,微軟宣布與位于西雅圖的健康技術(shù)和基因測序公司Adaptive Biotechnologies達成合作,Adaptive Biotechnologies的基因測序儀目前用于檢測殘余骨髓瘤——也就是說,細胞會顯示已經(jīng)接受血癌治療的人的細胞并非完全沒有這種疾病。

blob.png

現(xiàn)在,該公司正在考慮的不僅僅是追蹤一種疾病,目標是確定檢測任何可能讓你免疫系統(tǒng)遭受重創(chuàng)的東西,從感染到癌癥,而且依靠微軟的機器學習功能來幫助它達到這一目標的。

人體免疫系統(tǒng)的功能非常強大,人體體內(nèi)有二十億個淋巴細胞,其中稱為‘輔助’T細胞,其他是‘細胞毒素’或者‘殺傷性’T細胞。

每個T細胞都可以識別抗原——也就是免疫系統(tǒng)的觸發(fā)因素——這些抗原顯示進入人體的細菌、病毒、真菌或其他入侵者。每個T細胞可以結(jié)合數(shù)百種不同的抗原,每種抗原對于不同的細菌或病毒都是獨有的。

一旦T細胞受到打擊,(取決于T細胞的類型)它可能會殺死入侵者,或者向數(shù)百萬其他免疫細胞發(fā)出信號,讓這些細胞過來攻擊入侵者。當T細胞被激活時,對免疫系統(tǒng)進行快照,通過注意到哪些T細胞受體被激活以及哪些抗原與其結(jié)合,可以確定哪種疾病已經(jīng)侵入了人體。而且,一旦確定了疾病,醫(yī)生就可以更清楚地知道如何進行治療。

Adaptive Biotechnologies成立于2009年,致力于讀取和掃描免疫系統(tǒng)和免疫細胞上的受體。隨著時間的推移,該公司不僅追蹤免疫受體,而且也開始研究受體與其結(jié)合的抗原之間的聯(lián)系。通過研究這種約束關(guān)系,Adaptive Biotechnologies開始朝著能夠診斷來自免疫受體的特定疾病的方向努力著。

但隨后,根據(jù)Adaptive Biotechnologies首席執(zhí)行官、聯(lián)合創(chuàng)始人Chad Robins的說法,他們意識到“我們需要非常復雜的機器學習和計算能力才能真正解決問題——這是Web體量的一個大問題?!?/p>

微軟人工智能與研究副總裁PeterLee指出,每個人的基因組大約有200GB:“這僅僅是基因組數(shù)據(jù)——用于提取的元數(shù)據(jù),以及來自成像、可穿戴設(shè)備、(與人口規(guī)模的基因組數(shù)據(jù)關(guān)聯(lián)的)患者縱向健康記錄的數(shù)據(jù)來源,是非常巨大的。信息內(nèi)容遠遠超出了人類的理解,因此對人工智能和數(shù)據(jù)分析的需求確實變得至關(guān)重要?!?/p>

單個血液樣本通常會提取約一百萬個T細胞,這些T細胞中的每一個在基因上都是與特定抗原受體綁定的。將這些T細胞受體DNA序列的讀數(shù)翻譯成一組抗原,然后將這些抗原完美翻譯成疾病狀態(tài)。,是一個非常非常大的機器學習問題,”Lee補充說。

這時候就需要使用微軟的機器學習技術(shù)。微軟使用的算法是目前用于自然語言翻譯的算法?!斑@與我們在Bing搜索引擎中所謂的主題識別技術(shù)有一些相似之處,”Lee說。微軟使用AdaptiveBiotechnologies的MIRA系統(tǒng)生成訓練數(shù)據(jù)——這些訓練數(shù)據(jù)被用于創(chuàng)建從T細胞受體到抗原的“翻譯圖”,然后盡可能準確地將這些抗原映射回疾病。

這聽起來有點抽象,這種做法可能會帶來一些具體的好處:如果映射如Adaptive和微軟預想的那樣起作用了,那么這可能意味著患者在他們知道他們生病了之前就可能被診斷出患有疾病。例如,卵巢癌的癥狀非常隱蔽,直到晚期才會被發(fā)現(xiàn)。通過對患有基因突變(如BRCA1,會讓患者患卵巢癌的風險更高)的患者進行先發(fā)性檢測,這項檢測可以提取關(guān)于早期癌癥的指示性免疫信號。你越早發(fā)現(xiàn)疾病,治愈的可能性就越高。

Adaptive現(xiàn)在正在研究兩種“未滿足醫(yī)療需求的疾病,要么非常非常難以診斷以及/或者診斷需要治療干預,而這可能顯著影響對患者的護理,”Robins這樣表示。

Adaptive首先瞄準了一些疾病,一旦模型得到驗證,它希望使用相同的系統(tǒng)來累積越來越多的條件?!叭绻覀冋娴哪軌驈闹械贸鲈\斷結(jié)果,那么隨后幾年我們就會在接下來的兩年、五年以及未來二十年繼續(xù)推進,”微軟的Lee說。

一旦一種疾病被破解,機器學習能夠是否可以更容易或更快地破解下一種疾???

“讓我給你一個既樂觀又悲觀的答案。樂觀的是,隱藏層中的深層神經(jīng)網(wǎng)絡(luò)天生地學習了一些關(guān)于免疫系統(tǒng)工作方式的隱藏結(jié)構(gòu),然后了解了6種、60種、100種甚至更多疾病之后的某個時候,你只是實現(xiàn)了這種能力的爆炸。”從某種程度上說,神經(jīng)網(wǎng)絡(luò)可能僅僅能夠了解和解碼每種新疾病而不需要再訓練。

當然,存在一種悲觀的看法?!澳阋矔霰?。在某些時候,新增訓練數(shù)據(jù)的價值和新增計算能力的價值開始消失。有時候,我們會在機器翻譯等領(lǐng)域看到這一點:幾個月前,我們宣布我們在翻譯英文和普通話方面達到了人類的水平。我們獲得了90%的準確率,但為了獲得最后10%,我們需要2倍的計算能力和2倍的數(shù)據(jù)……目前我真的不知道我們在試圖將T細胞受體序列映射到抗原到疾病狀態(tài)方面處于什么樣的狀態(tài),我們希望是前者,但也可能是后者,或者某種形式上兩者兼有?!?/p>

雖然沒有人知道這個悲觀或者樂觀的觀點是否正確,但Adaptive預計第一個單一疾病診斷測試將在三年的時間進行,更全面的多病篩查測試將在八到十年的時間。

“隨著我們開始分層次地進行[每項單一疾病測試],一個接一個地進行,在某個時刻,一次性完成所有操作的成本效益、易用性和效率能夠達到足夠的水平。這將成為一個生物系統(tǒng)的視圖,這就是我們將要努力的目標,”Robins說。

就像你會定期去醫(yī)生那里進行檢查,或者在你到一定歲數(shù)的時候被要求進行乳房癌或腸癌篩查,未來你可能會被要求進行一次抽血,經(jīng)過分析告訴你要注意哪些疾病,甚至告訴你以前從來沒懷疑有過的癥狀。

Lee說,這個系統(tǒng)甚至有可能診斷出只有十億分之一可能性的癥狀,或者是一種全新的疾病。

“看起來我們將會發(fā)現(xiàn)那些我們還沒有弄清楚、不常見甚至是從沒見過的癥狀。這些觀察對于醫(yī)學研究和科學進步的價值問題是我們想知道的問題。這也是推動著我們針對那些剛開始生成、可能有助于科學發(fā)現(xiàn)的開放式探索?!?/p>

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2018-07-03
如何利用機器學習了解人體免疫系統(tǒng)?
把你的免疫反應看作是一個巨大的機器學習問題,你的身體就是計算機。免疫細胞在你的身體中移動,對它們接觸到的各種物質(zhì)進行取樣,從你自己的細胞,到絕對不應該存在的有機體細胞。

長按掃碼 閱讀全文