網易科技訊11月9日消息據外媒(opensources.info)報道,機器學習的進步讓人們能夠以更方便的方式來訓練安全系統(tǒng)以應對不斷變化的安全形勢。
近段時間,機器學習和人工智能受到越來越多的關注。新技術帶來的諸多可能讓人們興奮不已。
一個事物一旦被貼上機器學習的標簽,再想撕下來就難了。就像現(xiàn)在幾乎所有基于網絡發(fā)生的事情都能跟“云計算”扯上關系一樣,未來“人工智能”這個詞可能會跟“電腦”形影不離。
“大熱之下也有些夸張的成分,”普華永道(PricewaterhouseCoopers)分析師Anand Rao說。“人們開始討論AI變得超級聰明進而取代人類等等。”
在使用計算機的過程中,判斷新下載的文件或軟件是否含有惡意代碼是最常見的安全情形。通常的識別方法是將程序的數(shù)字簽名與已知的惡意軟件進行對比,以辨別安全與否。
這種基本的識別手段有其缺點:它依賴于惡意軟件數(shù)字特征庫的不斷隨時更新來保證識別能力。一旦更新落后或識別不及時,后果令人堪憂。一些特征不明顯的惡意軟件經??梢暂p易蒙混過關。
一家名為Deep Instinct的新創(chuàng)企試圖使用深度學習技術來彌補此中不足。公司團隊利用近10億個已知惡意軟件樣本對其深度學習系統(tǒng)進行訓練。
公司CTO Eli David 說:“深度學習改變了很多領域。計算機視覺每年增長20%~30%,此外還有語音識別。于是我們想為什么深度學習不能應用到網絡安全領域呢?”
他認為基于概率大機器學習系統(tǒng)十分有限,盡管非常多的因素可以被識別和評估,與此同時那些太過微小的因子遭到忽略。
“如此你白白丟掉了絕大一部分數(shù)據。”他說。
作為糾正,Deep Instinct 實驗室中無一遺漏地使用目前已知的所有惡意軟件樣本來訓練其深度學習系統(tǒng)。整個過程耗時一整天。而且使用到高性能圖形處理器來進行對數(shù)據的分析。
訓練產生的系統(tǒng)大小約有一千兆字節(jié),隨后公司將至精簡至二十兆字節(jié)。如此該系統(tǒng)可以被安裝到任何端點設備上,包括移動設備。即使在最慢的機器上,它也能在幾毫秒內完成對未知程序安全性的識別。
“檢測一兆的數(shù)據耗時不過一毫秒。” David 說。“我們在實驗室中包辦了所有復雜的準備工作,用戶的使用成本非常簡便。”
Deep Instinct 每三到四個月更新一次惡意軟件樣本庫,新的更新隨即會被部署到正在運行的設備上。David 稱,深度學習非常適合應對捉摸不定的變化。即使樣本庫更新延遲,該系統(tǒng)仍然有能力檢測新的文件。
每天不斷出現(xiàn)的新型惡意軟件大多都是在舊有惡意軟件上做細小改變。“即使是最有威脅性的新惡意軟件,其80%仍然是舊的。傳統(tǒng)檢測方法對這些喬裝素手無策,但深度學習能夠很容易地檢測它們。”
David 稱其公司正在同獨立的測試實驗室合作量化系統(tǒng)的檢測能力。早期同財富500強客戶的測試顯示,該系統(tǒng)檢測成功率比現(xiàn)有解決方案高出20%~30%。
“最近我們在美國一家大銀行做了100,000個文件的對比檢測?,F(xiàn)有的解決方案在測試的當天早上更新了樣本庫,而我們的樣本庫數(shù)據還是兩個月以前的。盡如此,我們的檢測成功率達到了99.9%,而對方只有40%。”
找出原因
最新的深度學習系統(tǒng)受人指責地一點是,它常常能給出結果,但卻不一定能夠解釋該結果究竟如何產生。
對此,大數(shù)據分析服務公司 Nutonian 使用名叫 Eureqa 的 AI 引擎來嘗試解釋結果產生的過程。
公司創(chuàng)始人和 CTO Michael Schmidt 表示, Eureqa 能像牛頓發(fā)現(xiàn)物理學中的萬有引力一樣,用最優(yōu)雅最簡單的方式來闡述事情原委及其中關系。
公司將 Eureqa 免費提供給研究人員使用,它已經間接幫助后者在超過500本雜志出版物中發(fā)表研究成果。在醫(yī)學應用中,它可以幫助診斷諸如黃斑變性和闌尾炎之類的疾病。該引擎在網絡安全領域也有助益。網絡安全中,最重要的便是識別攻擊的類型和手段,而 Eureqa 能夠自動完成這個類型檢測。
客戶將數(shù)據上傳到云端,服務器在一個小時之后就會傳回結果。“我們現(xiàn)已能夠在幾分鐘內重現(xiàn)過去需要幾個月甚至幾年才能完成的結果。”Schmidt 說。
本地與全局相結合
網絡安全形勢瞬息萬變,及時的更新對任何類型的機器學習系統(tǒng)來說都至關重要。
如果沒有更新,再先進的系統(tǒng)也會過時。人們總不斷弄出新的東西:員工打造新產品,供應商推出新程序,消費者購買新商品。當然,黑客也會不斷編寫出新的惡意軟件來繞過現(xiàn)有的檢測手段。
在下一次更新之前,總有漏洞存在。
別有企圖的程序員常常使用安全軟件來操練他們的攻擊手段,一旦找到有效的漏洞,那么這些安全軟件就變的形同虛設。糟糕的情況直到封堵該漏洞的更新出現(xiàn)才會結束。
“你可以使用本地模式(local patterns)、同行模式(peer patterns)和行業(yè)模式(industry-wide patterns),以不同的更新速度更新它們。”管理網絡公司 Masergy Communications 的首席科學家 Mike Stute 說。
Masergy 使用一定數(shù)量的全局檢測來尋找發(fā)生可疑事件的可能性,然后將其與本地指標相結合。全局系統(tǒng)只能檢測到有限的數(shù)據,科學家們至著眼于最常見的特征。
額外的局部焦點允許更多的輸入。Stute 稱:“在本地模型中,我們不必將它們壓縮到更小的功能集。”如此一來兼顧唯一性和準確性。
本地與全局相結合的策略也為企業(yè)咨詢公司 Acuity Solutions 所使用,其 BluVector 便使用機器學習來檢測網絡威脅。BluVector 習得正常程序應有的樣子,善于從惡意程序與正常程序的代碼差別中發(fā)現(xiàn)潛在威脅。
而且 BluVector 還會從新情況中學習,不斷升級自身的鑒別能力。其主引擎與全球數(shù)據每季度同步一次,但不會涉嫌上傳客戶信息。
全局與本地的有機結合使得每個客戶的 BluVector 部署都略有不同。即使攻擊者找出了系統(tǒng)的漏洞,該攻擊手段也未必對定制化之后的系統(tǒng)有效。
“這是一種移動防御策略,這些技術深度定制于你的環(huán)境而無法逆向破解。”Acuity 首席執(zhí)行官Kris Lovejoy 說。
- 比亞迪捐資30億元成立教育慈善基金,助力培養(yǎng)卓越人才,推動中國科教進步
- ?5年投入200億打造飛行汽車!?長安汽車布局萬億“低空”市場
- 英偉達涉嫌違反反壟斷法 市場監(jiān)管總局依法決定立案調查
- 上海敲定5G-A發(fā)展目標:到2026年發(fā)展500萬用戶,建設3.2萬個3CC基站
- 中國電信注資10億成立天通衛(wèi)星科技公司,將推動衛(wèi)星通信手機向3000元下探
- 上汽今年銷量或會被比亞迪反超,痛失18年“中國車企銷量冠軍”
- 英特爾CEO基辛格名為退休,實為被董事會趕下臺?
- 華為申請多枚鴻蒙辦公商標,涉及辦公用品等多個領域
- “數(shù)智化”登頂《咬文嚼字》十大流行語,數(shù)智技術應用深入人心
- IDC預計:2028年AI基礎設施支出將超1000億美元
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。