(一)孫悟空憑什么識(shí)破白骨精?
話(huà)說(shuō)西天取經(jīng)路上,一日正行到山頂,吃貨唐僧餓了,非讓悟空去南山搞幾個(gè)桃子。
正是這個(gè)蜜汁 Debuff 行為,讓唐僧暴露了自己的破腚,勾起了白骨精的食欲。白骨精但見(jiàn)八戒、沙僧護(hù)持,不得近身,化作少女、老嫗、白胡子老頭,三番接近唐僧,都被及時(shí)趕到的悟空識(shí)破,一棒子搗死。
這就是大家都“自以為”熟悉的三打白骨精。
我之所以說(shuō)“自以為”,是因?yàn)榇蠖鄶?shù)人不知道,吳承恩其實(shí)寫(xiě)了一個(gè)絕妙的“黑客寓言”:
唐僧,就是我們國(guó)家的大企業(yè)或職能部門(mén),代表朝廷完成重要使命的“御弟哥哥”嘛。
唐僧肉,就是企業(yè)里的機(jī)密數(shù)據(jù),壞人偷去肯定能賣(mài)個(gè)財(cái)務(wù)自由的好價(jià)錢(qián),相當(dāng)于長(zhǎng)生不老。
白骨精,當(dāng)然就是黑客,它想方設(shè)法變換不同形態(tài)接近大企業(yè),把“唐僧肉”給吃嘍。
悟空、八戒、沙僧,那就是網(wǎng)絡(luò)安全廠商,他們作為“乙方”,職責(zé)就是“識(shí)別黑客,干掉黑客”,保證唐僧“不掉血”嘛。
了解了這些比喻,再看三打白骨精的細(xì)節(jié),你就會(huì)發(fā)現(xiàn)一些秘密。
比如《西游記》原文有這么一段:
那女子被悟空打死后,帶來(lái)的飯菜都變成了蛆蟲(chóng)和蛤蟆,長(zhǎng)老已有三分信了這是個(gè)妖怪。
可八戒氣不忿,唆嘴道:師父,這個(gè)女子是此間農(nóng)婦,因?yàn)樗惋埾绿?,路遇我等,卻怎么栽她是個(gè)妖怪?哥哥的棍重,走將來(lái)試手打他一下,不期就打殺了;怕你念緊箍咒,故意使的障眼法,變作這樣?xùn)|西,演幌你眼,使不念咒哩!
這就怪了。本來(lái)事情都解決了,八戒為啥偏要“氣不忿”,瞎BB?
因?yàn)榘私浜芫礃I(yè),在他看來(lái),那根本就不是“黑客”,而是活生生的“正常訪問(wèn)”,放行正常流量本來(lái)就是乙方的職責(zé)嘛!
哎,世間的很多 Bug,都是“能力不夠”還“忠于職守”造成的呀。。。
先來(lái)解決一個(gè)全篇最重要的技術(shù)問(wèn)題:
為啥在豬八戒看來(lái),他們是三個(gè)不同的人;而孫悟空用火眼金睛一看,他們都是“白骨精”呢?
一句話(huà),是他們的認(rèn)知深度不同。
任何一個(gè)事物都兼具不同的屬性,它們有深有淺。越是表層的屬性,就越容易發(fā)生變化;越是深層的屬性,就越難變化。
比如白骨精,它能變成各種人,還能變成非人的東西,比如“小豬佩奇、奧特曼”;但是它無(wú)論怎么努力,都很難改變自己深層的“妖精”屬性。(此處白娘子端著雄黃酒罵罵咧咧退出群聊)
豬八戒的認(rèn)知能力弱,就只能看表層屬性,所以在三個(gè)場(chǎng)合中,把它判定為三個(gè)不同的人。
孫悟空的認(rèn)知能力強(qiáng),可以認(rèn)知深層屬性,所以在三個(gè)場(chǎng)合中,把它們判定為同一種東西——妖精。
兩人都盡力了。
但俗話(huà)說(shuō)“畫(huà)龍畫(huà)虎難畫(huà)骨,知人知面不知心”,不正是這個(gè)道理么?!
那孫悟空的“火眼金睛”到底是個(gè)啥原理,能認(rèn)知到這么深的屬性呢?
這里要給你科普一個(gè)詞:“特征維度”。
白骨精站在面前,咱們可以用不同的“特征”來(lái)描述它:
比如,眼睛、鼻子、嘴巴、穿著、打扮,這些都是一眼能看到的特征,就是“低維特征”。
比如,步態(tài)、眼神、談吐,這些就不是一眼能看穿的特征,需要仔細(xì)觀察才能獲得,這就是“高維特征”。
比如,氣場(chǎng)、性格、精神狀態(tài),這就是更難獲得的特征,需要綜合很多信息才能判斷出來(lái),這就是“更高維的特征”。。。
在豬八戒判斷“是人是妖”的模型里,更多使用了“低維特征”,于是很難準(zhǔn)確;而在孫悟空“火眼金睛”的模型里,更多使用了“高維特征”,更容易看到“妖氣”。
這位淺友說(shuō)了:中哥你厲害了呀,連“火眼金睛”這種魔法都能像模像樣地科普??
你懂的,我說(shuō)火眼金睛,怎么可能是為了說(shuō)《西游記》里的孫悟空,當(dāng)然是要給你介紹一位活生生存在于我們這個(gè)世界上的“孫悟空”。
他來(lái)了!此人就是夢(mèng)想建造一個(gè)龐大的 AI 系統(tǒng),從而洞悉世間一切黑客行徑的“火眼金睛博士”——曲武。
曲武
(二)造出火眼金睛,攏共分幾步?
朋友同事們很少稱(chēng)呼曲武的名字,大家一般叫他“曲博”??梢?jiàn),“博”已經(jīng)長(zhǎng)在了他身上。
那曲博是啥博士嘞?他是人工智能領(lǐng)域的博士。
話(huà)說(shuō)這里面其實(shí)有些“蹊蹺”。
蹊蹺在哪?我說(shuō)一件事兒你就明白了。2011年時(shí),曲博曾在清華的 KEG(知識(shí)工程研究室)搞研究。
而 KEG 實(shí)驗(yàn)室一直是中國(guó) AI 技術(shù)的領(lǐng)頭羊。2023年,全中國(guó)公認(rèn)最牛掰的“大模型” ChatGLM 就出自他們之手。
設(shè)身處地想一下:
老司機(jī)上了人工智能這個(gè)“高速”,卻沒(méi)有一腳油門(mén)踩到底去搞充滿(mǎn)鮮花掌聲的人工智能本“能”,而是一擰方向盤(pán),走上了用 AI 保衛(wèi)網(wǎng)絡(luò)世界的“岔路”。
這有點(diǎn)兒像白求恩不在加拿大享受人生,卻不遠(yuǎn)萬(wàn)里來(lái)到中國(guó),做出這種選擇本身就極不平凡。
要理解曲博為啥這么“想不開(kāi)”,我們不妨回到2011年去瞅一眼。
那一年,一家國(guó)內(nèi)頂尖的網(wǎng)絡(luò)安全公司正在和清華合作,目的是解決一些網(wǎng)絡(luò)安全技術(shù)的瓶頸。曲博就是清華派出來(lái)平事兒的“神獸”。
本來(lái),人家主要想解決的瓶頸是——“檢不過(guò)來(lái)”。
打個(gè)比方,IT 系統(tǒng)就像一個(gè)飛機(jī)場(chǎng),有很多男女老少的旅客,可是其中一些是白骨精變的。
為了找出白骨精,理論上每個(gè)人都要過(guò)一遍安檢,這沒(méi)錯(cuò)吧。
但是,安檢員干活兒忒慢,遇到旅客扎堆的極端情況,隊(duì)伍排出去2里地,旅客都要誤飛機(jī)了。為了機(jī)場(chǎng)正常運(yùn)轉(zhuǎn),只好隨機(jī)放掉90%的人,只安檢10%的人。
速度不夠快
安檢系統(tǒng)是屏障,放水肯定不行??!于是曲博把當(dāng)時(shí)方興未艾的“大數(shù)據(jù)技術(shù)”整套引入,讓數(shù)據(jù)查詢(xún)能力提升了上千倍,實(shí)現(xiàn)了“應(yīng)檢盡檢”。
瓶頸解決,安全公司相當(dāng)滿(mǎn)意,拱手道謝,準(zhǔn)備回家。
“等等!”曲博一聲喝號(hào),對(duì)方一激靈。
“你可知道,現(xiàn)在的產(chǎn)品,最大的瓶頸不在‘安檢速度’上,而是在‘安檢能力’上!”他擺出柯南斷案的姿勢(shì)。
能力不夠強(qiáng)
原來(lái),經(jīng)過(guò)一段時(shí)間的研究,曲博正是發(fā)現(xiàn)了我們?cè)凇兜谝徽隆分v的那個(gè)嚴(yán)重的問(wèn)題:
當(dāng)時(shí)即便是市面上最好的安全檢測(cè)系統(tǒng),使用的也都是“低維特征”。
它們的原理大概是這樣的:
1、每出現(xiàn)一種病毒,安全研究員就會(huì)對(duì)它人肉分析,找出其中包含的特別代碼字段,然后把這些字段做成“識(shí)別規(guī)則”;
2、每總結(jié)出一條新規(guī)則,就加入檢測(cè)引擎,下次“安檢”時(shí)如果有某個(gè)程序產(chǎn)生了相同的字段,就會(huì)擊中這個(gè)規(guī)則,不就證明這個(gè)程序是惡意的了么?
這些所謂的“代碼字段”,看上去唬人,但其實(shí)就相當(dāng)于“眼睛、鼻子、嘴巴”。
這次白骨精變了個(gè)少女,你就記下了少女眉眼的樣子,下次人家白骨精不變少女了,你就妥妥認(rèn)不出來(lái),給放行了。。。這檢得再快有啥用?
所以,把安檢流程做得快些固然重要,但更重要的,是把負(fù)責(zé)安檢的人從“豬八戒”升級(jí)成“孫悟空”啊!
曲博盤(pán)算,要真把孫悟空做出來(lái),中國(guó)網(wǎng)絡(luò)安全產(chǎn)業(yè)就會(huì)從“高老莊級(jí)”躍升到“齊天大圣級(jí)”,難道這個(gè)夢(mèng)想還不值得燃燒自己么?
越想越上頭,曲博一個(gè)急打方向盤(pán),沖上了網(wǎng)絡(luò)安全的“不歸路”。。。
話(huà)說(shuō),曲博這么篤定,他到底有多大勝算嘞?別嫌我啰嗦,咱們推演一下。
安全系統(tǒng)和黑客的較量,本質(zhì)上就是一個(gè)棋盤(pán)上黑白雙方的博弈:
一邊是黑客不斷思考——?jiǎng)?chuàng)造出新的攻擊方法;
另一邊是安全專(zhuān)家不斷思考——找出攻擊方法的特征。
正邪兩方都是頂尖的聰明人,好歹打個(gè)平手吧?
可別忘了,黑客是執(zhí)黑的“先手”,他總是先變化的一方。防守方哪怕緊跟黑客的變化總結(jié)規(guī)律,也會(huì)慢人一步。。。
這種不公平的局面下,防守方還想贏,那就必須比黑客更聰明,預(yù)判黑客的預(yù)判。
可是,安全研究員總歸還是人。人腦處理數(shù)據(jù)總會(huì)有一個(gè)物理極限,就算專(zhuān)家一瓶接一瓶喝腦白金,也沒(méi)法綜合更多數(shù)據(jù)總結(jié)出更高維的特征。
你看到了吧:“人”,其實(shí)是這個(gè)問(wèn)題的終極瓶頸。
怎么甩開(kāi)人呢?顯然是用“人工智能”!
AI 可以把多個(gè)電腦連在一起,對(duì)大量數(shù)據(jù)進(jìn)行聯(lián)合思考,從里面攥出來(lái)更多的“高維特征”。
只要特征維度足夠高,再聰明的人類(lèi)黑客在它面前都會(huì)被碾壓,乖乖露出狐貍尾巴。
以上推演,就是標(biāo)準(zhǔn)的“第一性原理”。
看懂這個(gè)原理,你也就明白了曲博為啥這么篤定。
說(shuō)回當(dāng)時(shí),懷揣這個(gè)想法,曲博開(kāi)始了“周游列國(guó)”。
他先是去了網(wǎng)絡(luò)安全公司啟明星辰。
可是當(dāng)時(shí)阿法狗還沒(méi)出來(lái),ChatGPT 更是沒(méi)影呢,這套 AI 理論太超前了,大家都不清楚怎么跟他配合,曲博的計(jì)劃推進(jìn)很慢,他只好背起包包,先去別處看看。
下一站是華為。
這里的同事們倒是很支持新技術(shù),可是沒(méi)想到,華為有嚴(yán)格的數(shù)據(jù)管理制度,不僅不能碰客戶(hù)的數(shù)據(jù),連華為公司內(nèi)部的數(shù)據(jù)都嚴(yán)格限制使用。
剛才說(shuō)過(guò),要想預(yù)判黑客的預(yù)判,最基本的操作就是把不同的數(shù)據(jù)放在一起思考。
現(xiàn)在不讓用數(shù)據(jù)。。。巧 AI 難為無(wú)米之炊呀。。。
此時(shí)節(jié),已經(jīng)到了2015年。雖說(shuō)折騰了半天產(chǎn)品沒(méi)能落地,但曲博并非一無(wú)所獲,從啟明到華為,他真真實(shí)實(shí)地收獲了一眾知音。
曲博在華為的同事胡文友,就是一個(gè)超級(jí)大知音。技術(shù)出身的老胡很快就看出了“火眼金睛”的潛力——AI 屬于“養(yǎng)成系”技術(shù),隨著時(shí)間推演,它能越變?cè)綇?qiáng)!所以這事兒不僅能成,還能大成!
知音閑暇時(shí)經(jīng)常一起嘮嗑,越嘮越覺(jué)得捉急。有一天,他倆突然福至心靈:要不。。。咱們。。。自己干???
金睛云華,就此成立。
那一年,曲博34,老胡44。
(三)你得先有“煉丹爐”
孫悟空的火眼金睛不是生來(lái)就有,而是在太上老君的煉丹爐里七七四十九天給煉出來(lái)的。
現(xiàn)實(shí)中的“火眼金睛”更是如此,要靠丹爐來(lái)煉!
那煉丹爐是啥嘞?就是插滿(mǎn)了顯卡的高性能服務(wù)器。
又是“顯卡”,又是“高性能”,一聽(tīng)就便宜不了——丹藥還沒(méi)煉成半個(gè),先是置辦煉丹爐就得幾百萬(wàn),這。。。錢(qián)從哪來(lái)?
曲博和老胡都是技術(shù)出身,一個(gè)賽一個(gè)老實(shí),也沒(méi)想著融資。正好當(dāng)時(shí)手頭攢了些錢(qián)準(zhǔn)備買(mǎi)房,倆人跟媳婦商量了一下,還是拯救世界更要緊,于是紛紛把買(mǎi)房錢(qián)都投進(jìn)了公司。
可即便這樣還不夠,籌備新公司還得招人,而且 AI 人才都死貴死貴的,于是他們又拉來(lái)一位朋友投了些錢(qián),總算把公司撐起來(lái)了。
錢(qián)都花在刀刃上了,其他地方就只好從簡(jiǎn)了。。。
就在北京的一所民居里,碩大的機(jī)柜開(kāi)始運(yùn)轉(zhuǎn)!
話(huà)說(shuō),這個(gè)“煉丹爐”簡(jiǎn)直是吃電狂魔,稍微一使勁就能把電閘給干跳了。找?guī)煾敌薇kU(xiǎn)絲?沒(méi)那預(yù)算!曲博自己上手,把電工手藝都給學(xué)會(huì)了。
這么耗電肯定發(fā)熱啊。空調(diào)?不用!曲博淘來(lái)了一個(gè)燒烤攤吹羊肉串那種大個(gè)兒風(fēng)扇,對(duì)著狂吹一樣解決問(wèn)題。。。
陽(yáng)臺(tái)上放的就是機(jī)柜。
雖然外觀簡(jiǎn)陋了些,但這“煉丹爐”里的東西卻是貨真價(jià)實(shí)!
啥東西呢?各種病毒。。。
原理是醬的:
曲博從全球最大的病毒庫(kù) VirusTotal 上把所有惡意代碼都下載下來(lái),然后在系統(tǒng)里制造好多沙箱,讓病毒在里面“釋放天性”,肆意展現(xiàn)出惡意行為;
同時(shí),一整套分析系統(tǒng)已經(jīng)拿好了小本本,從上帝視角把各路惡意代碼的表現(xiàn)完整記錄下來(lái);
這些數(shù)據(jù)集送到專(zhuān)家那里做必要的標(biāo)注,再投入人工智能的訓(xùn)練系統(tǒng),從中抽取出“高維特征”,做成一個(gè)“AI 模型”。
這個(gè) AI 模型,就是能識(shí)別惡意代碼的“火眼金睛”啦!
這張圖里,最下面是“煉丹爐”,中間是樣本數(shù)據(jù),上面就是訓(xùn)練出來(lái)的 AI 模型。
你看這一整套“煉制”流程里,除了標(biāo)注那一步還用到一些人工,其他地方已經(jīng)實(shí)現(xiàn)了自動(dòng)化流轉(zhuǎn)。(當(dāng)然,這一點(diǎn)點(diǎn)“人工”也并不能忽視,這里留個(gè)伏筆,后文我們還會(huì)細(xì)說(shuō)。)
總之,996的人工參與越少,系統(tǒng)效率就越能007:
世界上出現(xiàn)新的病毒,自動(dòng)收集,自動(dòng)進(jìn)入沙箱,自動(dòng)表現(xiàn)行為,自動(dòng)進(jìn)入煉丹爐,自動(dòng)改進(jìn)“火眼金睛”。
給你畫(huà)個(gè)動(dòng)圖感受下↓↓↓
論效率,比吭哧癟肚的人類(lèi)專(zhuān)家高到不知哪里去了;
論效果,AI 抽取的特征維度更高,更是碾壓人類(lèi)專(zhuān)家。
把這個(gè)火眼金睛和高速的檢測(cè)引擎裝在一起,就成了可以降妖捉怪的“孫悟空”——云鑒(ATD)高級(jí)威脅檢測(cè)系統(tǒng)。
大家沒(méi)日沒(méi)夜地干,只用了一年時(shí)間,就做出第一版 ATD。
ATD 有多猛嘞?我舉個(gè)小例子:
世界上活躍的病毒木馬,總共就那么幾十個(gè)家族。可是這么多年,都沒(méi)有被趕盡殺絕。
原因很簡(jiǎn)單,它和真實(shí)世界的病毒一樣,會(huì)不斷變異。
黑客在原有木馬基礎(chǔ)上做一些改動(dòng),或者根據(jù)原有的思路把關(guān)鍵部位重寫(xiě)一下,從代碼特征上看,新木馬就和舊木馬完全不同了。
此時(shí),給傳統(tǒng)的“豬八戒式”安全軟件來(lái)看,那就妥妥的是一位女施主,不能打殺了。。。
但是,ATD 卻把木馬的代碼轉(zhuǎn)換成圖像,再把新木馬和舊木馬的圖像特征做比對(duì)(這個(gè)特征就是高維特征了)。
這么一來(lái),哪怕黑客改動(dòng)、重寫(xiě)了很多地方,新舊木馬仍然能呈現(xiàn)出相似性,在 ATD 的火眼金睛看來(lái),還是白骨一堆!
這個(gè)彪悍的特性就叫“AI 驅(qū)動(dòng)的惡意代碼基因圖譜檢測(cè)”。
你看,完全不同的代碼,在圖像層面展現(xiàn)出了高度的相似性。
科普暫且告一段落,咱們回到曲博身邊。
2016年,曲博坐在屋子里看著自己的成果,像是上帝造好人間,準(zhǔn)備暫歇片刻。
可是,好像哪里不對(duì)。這么先進(jìn)的 ATD,大家腫么不來(lái)?yè)屬?gòu)呢?
曲博心里當(dāng)然明白,所有的創(chuàng)始人都是偏技術(shù)的,沒(méi)有人搞銷(xiāo)售。。。這酒雖然香,可是金睛云華這名字太耳生,安全行業(yè)沒(méi)你這一號(hào)啊,別人想了解你都沒(méi)門(mén)路,佛系得過(guò)分了。
看來(lái)看去,大伙兒的目光落在老胡臉上。老胡在華為做過(guò)很久的解決方案技術(shù)顧問(wèn),橫豎一比,他也是最接近“銷(xiāo)售”的人了。。。
“行,”老胡一拍桌子,“先拿我這張臉去刷刷看!”
客戶(hù)的門(mén)朝哪開(kāi)暫時(shí)不知道,但友商在哪兒還是能找到的,那就先去友商拜拜碼頭。
老胡在心里拉了一張名單,把各家創(chuàng)始人比較牛X、識(shí)貨的網(wǎng)絡(luò)安全公司來(lái)了個(gè)排排站。
在名單的前幾位,就是素有“黑客特種兵”之稱(chēng)的知道創(chuàng)宇。老淺友都熟悉,知道創(chuàng)宇的創(chuàng)始人趙偉也是出了名的猛人一位,懷揣家國(guó)情懷,想來(lái)和金睛云華能投脾氣。(想了解知道創(chuàng)宇,可以看《黑掉攝像頭,你看到好看的皮囊》《夜店里的風(fēng)雪罪案》)
那天正好趕上一位朋友要去創(chuàng)宇,老胡厚臉皮去蹭著串門(mén)。
到了知道創(chuàng)宇一聊,巧了!他們剛剛拿下公安部的一個(gè)訂單,其中一個(gè)子項(xiàng)就是要在大流量中發(fā)現(xiàn)黑客的行蹤,但客戶(hù)要求很高,傳統(tǒng)的技術(shù)怕是會(huì)導(dǎo)致很多誤報(bào),正想著用 AI 來(lái)試試。
再瞧金睛云華這個(gè)狀態(tài),東西做好了正想找個(gè)客戶(hù)闖闖名聲,真是困了有人送枕頭,直接合作不就妥了?
就這樣,聊天聊成了一筆訂單。
出得門(mén)來(lái),老胡還有點(diǎn)懵,現(xiàn)在生意這么好做的嗎,刷個(gè)臉就掉裝備?
如法炮制,老胡后來(lái)又結(jié)識(shí)了盛邦安全的小伙伴。話(huà)說(shuō)盛邦的創(chuàng)始人權(quán)小文也是一位技術(shù)深厚且低調(diào)沉穩(wěn)的大咖,我們?cè)凇毒W(wǎng)絡(luò)世界里關(guān)二爺大戰(zhàn)異形》里詳細(xì)介紹過(guò)他。
盛邦在網(wǎng)絡(luò)空間測(cè)繪領(lǐng)域做得非常扎實(shí),服務(wù)的很多客戶(hù)都是中國(guó)頂尖的網(wǎng)絡(luò)空間守衛(wèi)力量,有多頂尖呢?頂尖到我沒(méi)辦法提他們的名字,就叫“A類(lèi)客戶(hù)”吧。
盛邦不僅非常識(shí)貨,還很誠(chéng)摯,在這些客戶(hù)面前毫不吝嗇地推薦金睛云華,接連促成了幾筆訂單。
然而,這種“聊天式銷(xiāo)售”畢竟有點(diǎn)兒靠天吃飯的意思。
而且你懂的,A類(lèi)客戶(hù)都是干大事兒的,巴不得穿上迷彩偽裝,網(wǎng)絡(luò)防御武器用得再好也很難幫你宣傳。。。于是,第一波開(kāi)門(mén)紅之后,雖然打開(kāi)了局面,但沒(méi)想象中熱鬧。
2017年中,大伙兒盤(pán)算了一下,今年還是會(huì)微微虧損。。。
這是公司成立的第一年
曲博倒是心態(tài)穩(wěn)定,牛X的技術(shù)被大家接受,總要有個(gè)過(guò)程嘛,今年小虧,明年打平,后年不就有希望盈利了嘛!
話(huà)雖這么說(shuō),但這群人身后的“煉丹爐”可是一刻不停地在運(yùn)轉(zhuǎn),活像一個(gè)吞金巨獸!
眼看創(chuàng)業(yè)之初湊的錢(qián)已經(jīng)花了大半兒,底子還在一點(diǎn)點(diǎn)變薄,并不是每個(gè)人都能像曲博這么閑庭信步。
那天,另一位出資的朋友突然找到曲博和老胡,委婉地提出想自己去創(chuàng)業(yè),需要把投的錢(qián)退出去。。。
機(jī)關(guān)算盡,沒(méi)算出這一道晴天霹靂!
(四)翻身重上筋斗云
都是好朋友,要不是人家當(dāng)年給予信任,公司恐怕也難開(kāi)起來(lái);現(xiàn)在想退出,說(shuō)什么也應(yīng)該滿(mǎn)足??蓡?wèn)題是,錢(qián)都花了呀。。。
眼前只剩一個(gè)辦法:寫(xiě)欠條。
男子漢大丈夫,既然相信事兒能干成,寫(xiě)個(gè)欠條也是不礙的??墒?,真到要落筆的那天,曲博心里突然如潮翻涌。
手握這么好的技術(shù),為了改變世界,創(chuàng)業(yè)連房都沒(méi)買(mǎi),眼看北京房?jī)r(jià)翻了一番且不說(shuō),現(xiàn)在還要倒欠別人幾百萬(wàn)。退一萬(wàn)步,如果自己?jiǎn)紊硪蝗诉€好說(shuō),可是家里還有老婆,我怎么跟人家交代呢?
不簽?zāi)??也行,無(wú)非就是公司變賣(mài)資產(chǎn),取經(jīng)路上散伙,大家各自回花果山高老莊。
可是,這么多年的夢(mèng),就碎了??!
曲博跟老胡兩個(gè)人,坐在家附近一家貓屎咖啡門(mén)口的地上,兩個(gè)人大男人說(shuō)到這兒,眼淚再也忍不住了。
是死是活,總要了斷。曲博咬咬牙,決心回家跟媳婦坦白,要是媳婦說(shuō)不同意,第二天就開(kāi)會(huì)解散公司,縱有一萬(wàn)個(gè)不甘心,咱也不干了!
你是個(gè)男人,也是公司法人,無(wú)論怎么說(shuō)都應(yīng)該負(fù)責(zé)任。幾百萬(wàn)確實(shí)不少,但退一萬(wàn)步說(shuō),你的公司真的做不下去了,咱們一起去工作,憑咱倆的能力,五年還不清,十年也一定能還清!
這個(gè)字,你簽吧。
他的妻子說(shuō)。
“沒(méi)有這番話(huà),就不會(huì)有今天的金睛云華?!鼻┗貞?。
話(huà)說(shuō)當(dāng)時(shí),欠條寫(xiě)完,曲博發(fā)愣,創(chuàng)業(yè)這條路遠(yuǎn)比想象中兇險(xiǎn),只靠幾個(gè)人幾條槍單打獨(dú)斗總還是太單薄。
直到這時(shí),他和老胡才嚴(yán)肅地想到一個(gè)叫“融資”的東西。眼看別人融完資都挺嗨皮,咱們?yōu)樯恫辉囋???/p>
金睛云華公開(kāi)接受融資的消息放出去,如一石激起千層浪——你若是不說(shuō),還則罷了;你既然說(shuō)了,就別怪我們掏錢(qián)不客氣了。
先找過(guò)來(lái)的是啟明星辰的幾位老同事,曲博的技術(shù)有多強(qiáng),他們當(dāng)年可是首批圍觀群眾,為了戰(zhàn)略入股金睛云華,他們專(zhuān)門(mén)合伙成立了一個(gè)投資公司;
緊跟其后的是最初的兩位合作伙伴知道創(chuàng)宇和盛邦安全,金睛云華的系統(tǒng)在客戶(hù)系統(tǒng)里運(yùn)轉(zhuǎn)的效果如何,他們最知道底細(xì),雖說(shuō)創(chuàng)宇和盛邦自己還是篳路藍(lán)縷的創(chuàng)業(yè)公司,但是不管了,這么好的機(jī)會(huì)過(guò)了這個(gè)村兒就沒(méi)這個(gè)店兒了,投!
再后來(lái),技術(shù)嗅覺(jué)靈敏的網(wǎng)絡(luò)安全公司永信至誠(chéng),還有網(wǎng)絡(luò)安全界各方都尊敬的“校長(zhǎng)”譚曉生,還有很多財(cái)務(wù)投資者都加入了后續(xù)投資隊(duì)伍。
從合伙人退股到大家踴躍投資,劇情反轉(zhuǎn)如此之快,著實(shí)出乎曲博的意料。本來(lái)在幽暗中穿行的他,對(duì)“AI 驅(qū)動(dòng)安全”的 Slogan 又信心爆棚,手握劍柄,何妨再戰(zhàn)300合?
筋斗云,總算被悟空等來(lái)了。
話(huà)說(shuō),2018年其實(shí)是全世界網(wǎng)絡(luò)安全的一個(gè)分水嶺。
當(dāng)時(shí)大概發(fā)生了這么幾件事兒:
1、全球企業(yè)信息化普及,企業(yè)IT系統(tǒng)內(nèi)部的數(shù)據(jù)迅速膨脹,數(shù)據(jù)價(jià)值也猛然提升。
2、這些數(shù)據(jù)散發(fā)著“血腥味”,黑客們聞著味道就去了。面對(duì)巨大的價(jià)值,他們“值得”投入巨大的精力翻新攻擊手段,讓每次進(jìn)攻都產(chǎn)生巨大變化。
3、在黑客加力之后,傳統(tǒng)的“豬八戒式”網(wǎng)絡(luò)安全守衛(wèi)系統(tǒng)瞬間變得呆滯,漏洞百出。巨大的網(wǎng)絡(luò)棋盤(pán)上,正義陣營(yíng)的戰(zhàn)線(xiàn)變得岌岌可危。
但滄海橫流方顯英雄本色。
豬八戒被爆錘,孫悟空越戰(zhàn)越勇,揪出一波又一波黑客。實(shí)力已經(jīng)不允許金睛云華繼續(xù)低調(diào)了。。。
當(dāng)時(shí),某省的有關(guān)部門(mén)遇到一個(gè)棘手的問(wèn)題:
他們抓到了一批來(lái)自境外的網(wǎng)絡(luò)攻擊動(dòng)作,但是人類(lèi)專(zhuān)家沒(méi)辦法把這些攻擊動(dòng)作跟背后特定的國(guó)家和組織對(duì)應(yīng)起來(lái),從而影響后續(xù)針對(duì)性地防御。
于是,他們開(kāi)放了這個(gè)研究課題,“懸賞”讓能搞定的公司來(lái)做。
曲博一看,這事兒我們略懂啊,于是“揭了皇榜”。
爽文劇情出現(xiàn)了:
各種進(jìn)攻方式,在人類(lèi)看起來(lái)沒(méi)任何規(guī)律。但是 AI 打眼一看,它們的高維特征簡(jiǎn)直不要太明顯,就像小孩搭積木一樣,瞬間能準(zhǔn)確分類(lèi),對(duì)號(hào)入座。
就這樣,課題不僅順利完成了,還獲了獎(jiǎng),ATD 也順理成章地留在了相關(guān)部門(mén)繼續(xù)工作。
這件事剛塵埃落定,又有一個(gè)機(jī)會(huì)又出現(xiàn)在曲博他們面前。
2018年,CNCERT 舉辦了一場(chǎng)網(wǎng)絡(luò)安全引擎大賽。
CNCERT 的全稱(chēng)是“國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心”,專(zhuān)門(mén)負(fù)責(zé)發(fā)現(xiàn)和處置全國(guó)網(wǎng)絡(luò)中的異常事件,相當(dāng)于網(wǎng)絡(luò)空間里的“總城管”,重要性不言而喻。
他們當(dāng)時(shí)舉辦這場(chǎng)比賽,頗有“華山論劍”的意味——開(kāi)放一塊我們國(guó)家真實(shí)的網(wǎng)絡(luò),各路豪杰把最好的檢測(cè)產(chǎn)品拿出來(lái)實(shí)地探查,看看誰(shuí)能發(fā)現(xiàn)這里面的“隱藏黑客”↓↓↓
真實(shí)的網(wǎng)絡(luò),真實(shí)的產(chǎn)品,當(dāng)面鑼對(duì)面鼓,誰(shuí)都做不了假,這最適合金睛云華這種技術(shù)流的公司了。
ATD 剛部署進(jìn)去,就像點(diǎn)燃一顆閃光彈,把網(wǎng)絡(luò)空間映照得如同白晝,看到的情景讓所有人毛骨悚然。
一個(gè)黑客正駐留在某企業(yè)內(nèi)部,大口吸血,并且把吸到的數(shù)據(jù)通過(guò)一種極其怪異的姿勢(shì)傳往國(guó)外。
這種怪異的數(shù)據(jù)傳輸方式就是“隱蔽隧道”。
弱雞黑客,一般是進(jìn)去小心,出來(lái)粗心——拿到企業(yè)機(jī)密數(shù)據(jù)之后就會(huì)忘乎所以,直接大搖大擺通過(guò)正常途徑傳輸出來(lái)。
可他們想不到,很多安全產(chǎn)品都會(huì)在這個(gè)關(guān)卡做監(jiān)測(cè),一旦探測(cè)到高強(qiáng)度的信息外傳,就會(huì)觸發(fā)警報(bào),讓黑客的“努力”功虧一簣。
黑客大佬,就不會(huì)這么莽撞——他們會(huì)把數(shù)據(jù)加密成一段超長(zhǎng)的字符串,每8個(gè)字符一組,放在網(wǎng)址中間,假裝對(duì)這些網(wǎng)址進(jìn)行訪問(wèn)。
實(shí)際上,每“訪問(wèn)”一個(gè)網(wǎng)址,就相當(dāng)于對(duì)外傳出了8個(gè)字符。
一般的安全產(chǎn)品只會(huì)檢查明顯的數(shù)據(jù)外傳,而無(wú)法識(shí)別這種偽裝成“網(wǎng)址訪問(wèn)”的數(shù)據(jù)外傳。這就是“隱蔽隧道”的原理。
但再隱蔽,它的最終目的仍然是要把數(shù)據(jù)傳出去,和正常的網(wǎng)址訪問(wèn)存在特征區(qū)別。
只不過(guò),這些特征在人類(lèi)看來(lái)很難捉摸,但是給 AI 看,就非常容易區(qū)分出來(lái)。
由于“隱秘隧道”的搭建成本比較高,普通小黑客很少用,所以那次 ATD 抓到的很可能不是一般的小蟲(chóng)子,而是某個(gè)巨大怪獸的一只腳。。。
這件事情具體的調(diào)查交給了相關(guān)部門(mén)去執(zhí)行,后續(xù)情況曲博也沒(méi)看到,但他能看到的,是各種“華山論劍”的機(jī)會(huì)接踵而至:
從G20的安保,到各省大數(shù)據(jù)局的安全監(jiān)測(cè);大到骨干網(wǎng)安全篩查,小到各市、區(qū)的安全態(tài)勢(shì)感知,各路重要的組織單位都聞?dòng)嵹s來(lái),點(diǎn)名要金睛云華出馬。
從很多角度看,這時(shí)的 ATD 都已經(jīng)沖破了傳統(tǒng)網(wǎng)絡(luò)安全技術(shù)的瓶頸,成為了一個(gè)無(wú)可替代的“新物種”。
而回頭張望,正是無(wú)數(shù)同事的咬牙堅(jiān)持,眾多投資人的真金白銀,無(wú)數(shù)客戶(hù)的點(diǎn)贊,終究如眾人抱薪,終究成為了帶悟空扶搖直上的筋斗云。
話(huà)說(shuō)回來(lái),曲博的“神預(yù)測(cè)”果然應(yīng)驗(yàn):
2018年金睛云華收支平衡,2019年就實(shí)現(xiàn)了首次盈利,而且一直盈利至今。不過(guò)只有天知道,為了讓這個(gè)預(yù)測(cè)成真,有多少人拼了老命。
現(xiàn)金流稍微寬裕,曲博想到的第一件事兒不是喝酒慶祝,而是——升級(jí)煉丹爐??!
(五)孫悟空 Pro Plus Max
2019年時(shí),金睛云華已經(jīng)告別民居,搬到了一座小別墅里,“煉丹爐”的機(jī)柜也從最初的1個(gè)變成了8個(gè),專(zhuān)門(mén)放在單間里,引擎轟鳴,煞是拉風(fēng)。
但這個(gè)規(guī)模,只有曲博設(shè)想中的十分之一,沒(méi)錯(cuò),他想升級(jí)成80個(gè)機(jī)柜!
這么多機(jī)器板卡肯定要花巨資去買(mǎi),這暫且不論。曲博問(wèn)了一圈, 單是在北京海淀區(qū)找一個(gè)用來(lái)放置8個(gè)機(jī)柜的機(jī)房都要一年近百萬(wàn)租金。。。
這。。。不太符合金睛云華艱苦創(chuàng)業(yè)的精神面貌呀!
北京機(jī)房
曲博眉頭一皺,計(jì)上心來(lái)。
他想到了自己的家鄉(xiāng)大慶。
曲博的老爸很早就下海做生意,家里有一個(gè)小工廠,只不過(guò)經(jīng)營(yíng)策略比較保守,童叟無(wú)欺,沒(méi)有搞太大。用曲博的話(huà)說(shuō),“三十年前是百萬(wàn)富翁,現(xiàn)在還是百萬(wàn)富翁。。?!?/p>
這兩年工廠生意一般,廠房閑置。這不巧了嗎,正好可以用來(lái)放“煉丹爐”。只有一樣,80臺(tái)機(jī)柜的發(fā)熱太大,需要做專(zhuān)門(mén)的散熱系統(tǒng)。
曲博多方打聽(tīng),在河南有一家銀行,由于規(guī)劃變更,剛建好一個(gè)機(jī)房就要變賣(mài),拆下來(lái)一套全新二手空調(diào)設(shè)備只要不到20萬(wàn)。他趕緊交錢(qián)買(mǎi)下了這個(gè)“餡餅”,雇卡車(chē)奔襲千里,把空調(diào)運(yùn)到大慶。
可是大慶的安裝團(tuán)隊(duì)都不是專(zhuān)業(yè)弄機(jī)房的,給他們做不放心,從北京派人過(guò)去又太貴,這可咋整?
曲博看了一眼65歲的老爸:“爸,你要不要親手支持一下國(guó)家的網(wǎng)絡(luò)安全事業(yè)?”
就這樣,老爸、姐夫,全家“壯丁”齊上陣,搞了幾個(gè)月時(shí)間,把各種設(shè)備安裝到位,只剩最后的電力調(diào)試。這要誰(shuí)來(lái)干呢?
好說(shuō),高級(jí)電工兼金睛云華 CEO 曲博親自上陣!
曲博和父親
十一期間,曲博回到老家,把機(jī)房進(jìn)行了最終調(diào)試。
三,二,一,點(diǎn)火!
就這樣,在大慶這個(gè)北方的石油之城,一個(gè)不起眼的廠房里,架起了“煉丹爐 Pro Plus Max”,人工智能燃起了的熊熊烈焰。
我敢打賭,2019年曲博在建立這個(gè)機(jī)房時(shí),幾乎不可能預(yù)料到后來(lái)發(fā)生的一切。
而故事講到這里,咱們也終于要上快車(chē)道了??!
估計(jì)很多淺友都知道,最近幾年人類(lèi)科技領(lǐng)域有一個(gè)超級(jí)大發(fā)現(xiàn):
人工智能的能力大小和它的規(guī)模大小不是線(xiàn)性關(guān)系,而是一種奇特的“涌現(xiàn)”關(guān)系——當(dāng)模型突破一定的規(guī)模,它的能力會(huì)爆炸式地躍遷。
這就好像你去商場(chǎng)買(mǎi)東西,買(mǎi)一贈(zèng)一,買(mǎi)二贈(zèng)二,買(mǎi)三贈(zèng)三。
但是,當(dāng)你買(mǎi)一百時(shí),就不是贈(zèng)一百了,而是直接贈(zèng)一萬(wàn)。仿佛卡到了了不得的 Bug。。。
大慶機(jī)房
2020年,一篇又一篇的論文懟在曲博眼前,讓他心潮澎湃。
無(wú)數(shù)前沿研究開(kāi)始證明,如果把 AI 模型做到足夠大,至少會(huì)帶來(lái)兩樣天大的好處:
1、AI 可以提煉出更高維度的特征,一下子比以前聰明百倍千倍;
2、AI 可以掌握“自學(xué)”的能力,再也不需要老師傅給它喂那么多的標(biāo)注數(shù)據(jù)。
沒(méi)錯(cuò),這套技術(shù)就是如今火遍全宇宙的 ChatGPT,的前身,“預(yù)訓(xùn)練大模型”。
大模型千好萬(wàn)好,只有一條:必須家里有礦——有非常大的計(jì)算集群才能訓(xùn)練。
曲博樂(lè)了,哦,煉丹爐是吧,咱家有?。?!
就這樣,在很多安全公司還在跟傳統(tǒng)人工智能搏斗的時(shí)候,金睛云華已經(jīng)在大模型的路上打怪殺敵了。
他們是怎么做的呢?
在金睛云華的“小模型”時(shí)代,他們的做法是:把黑客的行為分成了30多個(gè)類(lèi)別,比如“SQL 注入”、“Webshell”、“C&C通訊”,還有之前提到過(guò)的“隱蔽隧道”之類(lèi)。。。
針對(duì)每一類(lèi)行為,他們都開(kāi)發(fā)了一個(gè)人工智能模型。
這就相當(dāng)于搞了30多個(gè)孫悟空,每來(lái)一個(gè)人,都要30多個(gè)孫悟空檢查一遍才知道你是不是白骨精。
這顯然會(huì)讓“安檢流程”比較費(fèi)事↓↓↓
但是,最費(fèi)事的其實(shí)不是“安檢環(huán)節(jié)”,而是之前的“訓(xùn)練環(huán)節(jié)”。
你可能還記得,之前我們埋了一個(gè)伏筆。雖然“煉丹”環(huán)節(jié)大部分都實(shí)現(xiàn)了自動(dòng)化,但是唯有一個(gè)環(huán)節(jié),就是“樣本標(biāo)注”還需要大量的人工參與。
具體來(lái)說(shuō),這叫“監(jiān)督學(xué)習(xí)”,一個(gè)小模型需要經(jīng)過(guò)100萬(wàn)個(gè)樣本投喂才能“畢業(yè)”。
30多個(gè)模型,每個(gè)都需要這樣“監(jiān)督”一遍,其中的工作量可想而知。
但是,大模型的訓(xùn)練原理完全變化了,成了“非監(jiān)督學(xué)習(xí)”。
你先不用標(biāo)注,把各種數(shù)據(jù)一股腦喂給大模型,讓他“自己體會(huì)”。體會(huì)明白后,它就掌握了事物的內(nèi)在聯(lián)系。
在此基礎(chǔ)上,你再用少量的標(biāo)注樣本進(jìn)行精調(diào),讓它明白你想干啥,就行了。
這個(gè)用于精調(diào)的樣本,大概只需要5-10萬(wàn)個(gè)。你想要完成30多類(lèi)任務(wù),就拿30多組樣本都給這一個(gè)模型看,就夠了。
這樣搞下來(lái),你最后得到的是一個(gè)完整的“孫悟空 Pro Plus Max”,一個(gè)頂過(guò)去三十個(gè),還能更聰明千百倍,人工工作量還直降90%-95%,簡(jiǎn)直是開(kāi)掛一般的存在!
后來(lái),曲博激動(dòng)地把公司投資人之一譚曉生請(qǐng)來(lái),給他嘚瑟了一下這個(gè)驚人成果。
譚曉生豎起大拇指:“這條路被你們走通了!”
話(huà)說(shuō)當(dāng)時(shí),大模型加持的 ATD 雖然好使,但究竟能好使到什么程度,其實(shí)曲博自己也不太拿得準(zhǔn)。
他決定挑戰(zhàn)一把極限,死磕網(wǎng)絡(luò)安全界最大的難題之一——加密惡意流量。
加密一直是人類(lèi)技術(shù)皇冠上的明珠。戰(zhàn)爭(zhēng)中最底層的技術(shù)對(duì)抗大多發(fā)生在加密領(lǐng)域。大名鼎鼎的圖靈,就是靠破譯了德軍的加密體系,才讓二戰(zhàn)局勢(shì)迅速倒向盟軍一方嘛!
網(wǎng)絡(luò)戰(zhàn)爭(zhēng)更是如此,真正“活兒好”的大黑客,會(huì)在他的每一次信號(hào)傳輸中都使用加密指令,全程不露馬腳——你都打不開(kāi)它的包裹,怎么判斷里面是不是炸彈呢?
以加密方式傳輸指令,就像一個(gè)個(gè)嚴(yán)實(shí)的包裹。
這時(shí)候,曲博身上的“博”開(kāi)始發(fā)揮作用,他扎進(jìn)了論文的海洋游了一遍,發(fā)現(xiàn)了秘密:主流加密算法,為了實(shí)現(xiàn)效率和安全的平衡,都犧牲了一定的隨機(jī)性。
也就是說(shuō),即便使用了這些主流加密方法,在極高維度上,惡意流量仍然能展現(xiàn)出其固有的特征。
有了這個(gè)理論加持,曲博心里有數(shù)了,接下來(lái)就看大模型的“發(fā)揮”了。
經(jīng)過(guò)幾個(gè)月的“特訓(xùn)”,見(jiàn)證奇跡的時(shí)刻到了。曲博差點(diǎn)蹦起來(lái)——果然不用解密,AI 照樣能識(shí)別出來(lái)壞人!
這意味著,“孫悟空 Pro Plus Max”不僅有火眼金睛,還具備了隔著帳??辞逖醯摹皯医z診脈”能力!
這個(gè)瞬間,在我看來(lái)就是網(wǎng)絡(luò)安全的“阿法狗時(shí)刻”。
2021年以前金睛云華的 ATD 系統(tǒng),雖然超越了99%的人類(lèi)專(zhuān)家,但是在和最頂尖的人類(lèi)專(zhuān)家還是難分伯仲的。
但再頂尖的人類(lèi)專(zhuān)家,也不可能識(shí)別出“加密流量”。
在這一點(diǎn)上,AI 相當(dāng)于打敗了安全專(zhuān)家中的李世石和柯潔,從此能夠毫無(wú)疑義地代表人類(lèi)全體,向遠(yuǎn)方眺望。
這種成就感難以言表。
講真,加密流量基本相當(dāng)于網(wǎng)絡(luò)安全的“腫瘤”。很多企業(yè)苦加密久矣,這時(shí)節(jié)終于看到有人能解決這個(gè)問(wèn)題,紛紛“請(qǐng)兵拿賊”。
看大家熱情高漲,曲博干脆把加密流量檢測(cè)專(zhuān)門(mén)獨(dú)立出來(lái),做成了如今的“云晰”(ETD)系統(tǒng)。
就在金睛云華眾將還沒(méi)來(lái)得及好好慶祝時(shí),曲博一回頭,ChatGPT 橫空出世。
他放下酒杯,暗自點(diǎn)頭——不妨等一會(huì)兒,老夫再去溫酒斬個(gè)華雄,回來(lái)一起慶祝!
(六)八萬(wàn)四千根毫毛
這個(gè)要斬的“華雄”是誰(shuí)呢?
話(huà)說(shuō),曲博之前六七年做的 ATD 系列,都是在做“安全檢測(cè)”。
但是客觀來(lái)說(shuō),網(wǎng)絡(luò)安全保衛(wèi)的工作是一個(gè)完整的體系。就像那取經(jīng)路上,降妖捉怪最多是“1%的靈感”,剩下“99%的汗水”是沙和尚白龍馬老老實(shí)實(shí)扛著行李往前走。
這些日常工作就是“安全運(yùn)維”(SecOps)。
我們還是回到機(jī)場(chǎng)的比喻。機(jī)場(chǎng)安檢口要想正常運(yùn)作,安檢儀只需要一臺(tái),但旁邊的輔助人員需要一大堆!
你在機(jī)場(chǎng)仔細(xì)觀察,會(huì)發(fā)現(xiàn)很有意思的特點(diǎn):
“安檢輔助員”總體并不需要特別高的專(zhuān)業(yè)知識(shí),但是,他們又必須能夠靈活應(yīng)變,處理各種繁瑣的小災(zāi)小情,一會(huì)兒這個(gè)人充電寶超標(biāo),一會(huì)兒那個(gè)人私藏打火機(jī),一會(huì)兒有人帶超過(guò)100毫升的液體。
正因?yàn)楣ぷ鲀?nèi)容太開(kāi)放,這個(gè)崗位一直沒(méi)能被機(jī)器替代。
即便今天,你去安檢口也會(huì)看到一票工作人員圍著安檢儀忙前忙后。
網(wǎng)絡(luò)安全的運(yùn)維領(lǐng)域也是如此,平常要對(duì)各種系統(tǒng)告警進(jìn)行查看,大部分異常只需要簡(jiǎn)單處理就過(guò)了,只有小部分需要跟蹤深挖。
但這個(gè)行業(yè)存在兩個(gè)問(wèn)題:
一,人才缺口;
二,效率瓶頸。
業(yè)內(nèi)普遍認(rèn)為,中國(guó)網(wǎng)絡(luò)安全的人才缺口在100萬(wàn)左右。
這100萬(wàn)主要就是指安全運(yùn)維人員。之所以存在缺口,主要是因?yàn)榘踩\(yùn)維的定位——賺白菜錢(qián)操白粉心,高級(jí)人才不愛(ài)干,低級(jí)人才又干不了。
所以很多公司愣是找不到合適的運(yùn)維團(tuán)隊(duì)。
退一萬(wàn)步,即便費(fèi)了九牛二虎之力湊齊一組運(yùn)維人員,但他們畢竟還是肉身凡胎的人。
在 AI 的加持下,那1%的靈感(安全檢測(cè))不斷擺脫人力限制,越轉(zhuǎn)越快;可這99%的汗水(安全運(yùn)維)卻要依賴(lài)人工,為了不至于拖整個(gè)安全系統(tǒng)的后腿,就得不斷加人??傮w成本根本控制不住。。。
我們又遇到了那句話(huà):人是“終極瓶頸”。
孫悟空(安全檢測(cè))在長(zhǎng)大的過(guò)程中,沙和尚(運(yùn)維)就得不斷增多。
巧了,2023年 ChatGPT 所代表的自然語(yǔ)言大模型的崛起,正好可以用來(lái)解決這個(gè)問(wèn)題。
誒,怎么剛說(shuō)過(guò)大模型,這里又來(lái)了一個(gè)大模型?
之前用來(lái)做安全檢測(cè)的大模型,只需要理解程序語(yǔ)言就行,所以叫程序語(yǔ)言大模型,里面大概有1億個(gè)參數(shù);
而 ChatGPT 這種叫自然語(yǔ)言大模型,可以理解人類(lèi)語(yǔ)言。人類(lèi)語(yǔ)言比程序語(yǔ)言復(fù)雜得多,所以自然語(yǔ)言大模型有100億以上的參數(shù)。
可想而知,制造這個(gè)自然語(yǔ)言大模型所需要的算力就更大了,曲博那個(gè)煉丹爐終于煉不下了。。。
幸運(yùn)的是,“普天之下程序員皆兄弟”,這一波全世界的開(kāi)源技術(shù)社區(qū)異常給力,很快就出現(xiàn)了極高質(zhì)量的開(kāi)源大模型,包括 Mata 的 LLaMA 和清華系公司“智譜 AI”的 ChatGLM。(有關(guān)開(kāi)源精神,可以看《開(kāi)源武林》)
理論上來(lái)說(shuō),在這些語(yǔ)言大模型之上,只要用大量網(wǎng)絡(luò)安全處置報(bào)告和相關(guān)文檔對(duì)它進(jìn)行“精調(diào)”,就能讓它掌握運(yùn)維知識(shí)——這個(gè)活兒煉丹爐是能干的!
訓(xùn)練好之后,遇到問(wèn)題你只要問(wèn)它,它就會(huì)給出具體的運(yùn)維建議,從而讓“SecOps”變成“AISecOps”。
如此,就能大幅減少運(yùn)維人員的數(shù)量:一個(gè)頂過(guò)去五個(gè)。
以上只是曲博的理論推演,現(xiàn)實(shí)中真想把它做好,還需付出愚公移山之力。
曲博點(diǎn)點(diǎn)頭,把之前 ATD 系列產(chǎn)品交給研發(fā)負(fù)責(zé)人劉兵執(zhí)掌,自己當(dāng)愚公,帶隊(duì)殺進(jìn)了自然語(yǔ)言大模型的“山”里。
2023年夏天,經(jīng)過(guò)近半年的封閉開(kāi)發(fā),他帶著新成的黯然銷(xiāo)魂掌走出絕情谷,這就是 CyberCopilot。
跟我聊天時(shí),曲博像請(qǐng)出自家小孩給我表演節(jié)目那樣,展示了 CyberCopilot 的諸多“才藝”:
首先,它是一個(gè)百科全書(shū)。
比如你問(wèn)它一個(gè)漏洞的詳情、原理,它就老老實(shí)實(shí)給你講解。
然后,它可以識(shí)別各種單獨(dú)的攻擊事件。
你給他看一段代碼,它就能告訴你這很可能是黑客在進(jìn)行“SQL 注入”或者“XSS 攻擊”,并且給你處置建議。
最后,它還能把各個(gè)攻擊事件關(guān)聯(lián)起來(lái)。
描摹出黑客從溜門(mén)撬鎖到挨屋翻找的全貌,最終搞清黑客的來(lái)龍去脈,有針對(duì)性地阻斷或反擊。
這三樣工作仿佛上層樓:一個(gè)比一個(gè)難,而且前一個(gè)是后一個(gè)的基礎(chǔ)。
我坐在對(duì)面,看著曲博問(wèn) CyberCopilot 這些我?guī)缀趼?tīng)不懂的問(wèn)題,有血有肉的回答就這么在我眼前順暢地流淌出來(lái)。
這些精辟的理解背后,無(wú)疑只是一堆冰冷的服務(wù)器,唯技術(shù)給了它們靈魂。意識(shí)到這個(gè)事實(shí),我恍如隔世,仿佛站在西斯廷教堂欣賞創(chuàng)世紀(jì)。
在《西游記》中,孫悟空有八萬(wàn)四千根毫毛,拔一根毫毛就能變出一個(gè)小猴子。打起仗來(lái),可以瞬間變出無(wú)數(shù)援兵。如今看來(lái),CyberCopilot 不就是這些毫毛么?
正應(yīng)了亞瑟·克拉克那句話(huà):“一切先進(jìn)的技術(shù),皆與魔法無(wú)異?!?/strong>
動(dòng)畫(huà)截取自上影廠《大鬧天宮》(1964)
曲博把程序語(yǔ)言大模型和自然語(yǔ)言的大模型合稱(chēng)為 CyberGPT。
在他看來(lái),雖然程序語(yǔ)言的大模型完成的任務(wù)更為精尖,但畢竟場(chǎng)景有所局限,而自然語(yǔ)言的大模型,場(chǎng)景更為廣泛,值得寄予厚望。
現(xiàn)在 CyberCopilot 對(duì)于一般問(wèn)題回答的準(zhǔn)確度已經(jīng)達(dá)到了90%,按理說(shuō)已經(jīng)進(jìn)入了可用狀態(tài)。但曲博要求完美,有些回答里序號(hào)寫(xiě)得不對(duì),或者用詞不夠準(zhǔn)、剖析不夠深,他都不滿(mǎn)意。
目前,CyberCopilot 只給合作最緊密的種子客戶(hù)“發(fā)號(hào)”內(nèi)測(cè),搜集問(wèn)題改進(jìn)表現(xiàn),期待后面再找合適的機(jī)會(huì)放出這個(gè)大招。
“你這么耐心打磨,不擔(dān)心財(cái)大氣粗的大公司搶先一步推出競(jìng)品嗎?”我問(wèn)了一個(gè)很現(xiàn)實(shí)的問(wèn)題。
其實(shí)我已經(jīng)看到了一些網(wǎng)絡(luò)安全公司宣布了類(lèi)似產(chǎn)品,但他們的展示全都是錄像,而且效果過(guò)于完美,這有點(diǎn)兒反常。
我搞人工智能這么久,很清楚現(xiàn)在的技術(shù)能做到什么程度。一些友商的反常,反而讓我堅(jiān)信自己是領(lǐng)先的,這時(shí),我更需要穩(wěn)妥,拿出真東西。
曲博如是分析。
我是外行,雖不敢妄斷技術(shù),但完全認(rèn)同他的思維邏輯。歷史的大潮洶涌,當(dāng)你確信自己已經(jīng)站在了潮流的正確一側(cè)時(shí),“走得穩(wěn)”顯然比“走得快”更有希望抵達(dá)彼岸。
而我所見(jiàn)的歷史大潮,并不僅僅是大語(yǔ)言模型,而是更廣闊的“用 AI 替代人”。
(七)CyberGPT 的野望
如果俯瞰國(guó)際網(wǎng)絡(luò)安全的歷史,大概能看出每4年變化一次格局:
2010-2014年,網(wǎng)絡(luò)空間的領(lǐng)土概念逐漸清晰;
2014-2018年,各國(guó)開(kāi)始建設(shè)網(wǎng)絡(luò)安全“國(guó)家隊(duì)”;
2018-2022年,網(wǎng)絡(luò)空間攻防武器開(kāi)始了快速升級(jí)換代的競(jìng)賽;
2022年至今,網(wǎng)絡(luò)安全武器開(kāi)始“用 AI 替代人”。
我知道,很多人看到“AI 替代人工”的字眼,會(huì)有天然的抵觸。但是我要說(shuō),網(wǎng)絡(luò)安全和“外賣(mài)”、“制造業(yè)”之類(lèi)產(chǎn)業(yè)并不等同。
網(wǎng)絡(luò)空間中的導(dǎo)彈就是“信號(hào)”。所有信號(hào)都是以光速傳播的,每一回合攻防,哪怕快上零點(diǎn)零幾秒,都會(huì)積累優(yōu)勢(shì),最終決定戰(zhàn)局的倒向。
它事關(guān)國(guó)家安危,必須以效果和效率為第一考量:
所謂效果,就是消除人類(lèi)的思考瓶頸,發(fā)現(xiàn)人發(fā)現(xiàn)不了的問(wèn)題——這是程序語(yǔ)言大模型的領(lǐng)域。
所謂效率,就是消除人類(lèi)的反應(yīng)瓶頸,做出超越人的快速反應(yīng)——這是自然語(yǔ)言大模型的領(lǐng)域。
在這個(gè)過(guò)程中,人工環(huán)節(jié)的瓶頸被清除得越深刻,就越能消除武器發(fā)揮威力的障礙。
這一點(diǎn)無(wú)論對(duì)于攻擊方還是防守方都至關(guān)重要——哪怕我們無(wú)比熱愛(ài)和平,也別無(wú)選擇地要發(fā)展“AI 反導(dǎo)系統(tǒng)”。
以上,正是 CyberGPT 的野望。
2022和2023,金睛云華的兩家股東永信至誠(chéng)和盛邦安全接連敲鐘上市,這成為了某種召喚。
原本曲博也沒(méi)想那么多,但有了 CyberGPT 之后,他清晰地看到了金睛云華上市的可能性,決定為這個(gè)目標(biāo)努力。
“你這么佛系,也期待 IPO 么?”我問(wèn)。
“那當(dāng)然?!彼?。
可是隨即他表情又嚴(yán)肅了起來(lái)。
也許沒(méi)人完全理解我們一路走下來(lái)吃了多少苦。
那么多兄弟都受不了掉隊(duì)了,咬牙堅(jiān)持下來(lái)的人,理應(yīng)獲得屬于他們的尊重,而財(cái)務(wù)回報(bào)就是最好的尊重。
而對(duì)我來(lái)說(shuō),IPO 帶來(lái)的不僅僅是錢(qián),它更是一種證明,證明這么多年堅(jiān)持的路走通了。
曲博說(shuō)。
我恍然明白,十多年前他選擇“AI+安全”這條路有多么鄭重。而拼盡全力賭上時(shí)光只想把一條路走通,又是怎樣的執(zhí)念。
把這條路走通的代價(jià)之一,正是與曾經(jīng)并肩的兄弟告別,和與之相隨的無(wú)法與人言說(shuō)的悲歡離合。
每逢過(guò)節(jié),曲博都會(huì)特別囑咐,給已經(jīng)離開(kāi)的業(yè)務(wù)骨干留一份禮品。那是他堅(jiān)持的一種小儀式。
“有人不理解你,你會(huì)覺(jué)得遺憾嗎?”我問(wèn)。
遇到事情,當(dāng)然絕大多數(shù)是壞事,最后要做決定的那個(gè)人一定是我,這很折磨人。
因?yàn)槲业囊恍Q定,有些陪伴了三年五年的同事最后還是離開(kāi)了,我尊重他們的決定,也接受這些遺憾。
但我的目的本就不該是為了讓所有人理解我。我能做的,只是讓那些問(wèn)題有一個(gè)結(jié)果,然后我們可以繼續(xù)向前走。
他說(shuō)。
我聽(tīng)到曲博說(shuō)“繼續(xù)向前走”的那一刻,其實(shí)并沒(méi)太多感觸。但是,告別他之后走在寬闊的夕陽(yáng)里,我卻感到一支箭正中眉心。
他想說(shuō)的意思,恐怕《西游記》里已寫(xiě)得清楚。
《尸魔三戲唐三藏》這一章的結(jié)尾,唐僧動(dòng)怒,說(shuō)什么都要攆孫悟空回花果山。
大圣無(wú)奈,把身一抖,收上毫毛,卻又吩咐沙僧道:
“賢弟,你是個(gè)好人,卻只要留心防著八戒詀言詀語(yǔ),途中更要仔細(xì)。倘一時(shí)又妖精拿住師傅,你就說(shuō)老孫是他大徒弟。西方毛怪,聞我手段,不敢傷我?guī)煾?!?/p>
孫悟空恐怕并非與哪家妖精結(jié)有冤仇,可他執(zhí)意斬殺白骨精,甚至賭上師徒情分,難道不就是為了能“繼續(xù)向前走”嗎?
繼續(xù)走,走到通天坦途,走到河清海晏,走到西天如來(lái)。
站在彼岸回首來(lái)處,“齊天大圣的存在”本身,才是讓魑魅魍魎毛骨悚然的事實(shí)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )