虛假賬號(hào)不斷進(jìn)化,AI能做的還是有限

原標(biāo)題:虛假賬號(hào)不斷進(jìn)化,AI能做的還是有限

文 | 顏璇

來(lái)源 | 智能相對(duì)論(ID:aixdlun)

你的社交平臺(tái)擁有多少個(gè)粉絲?

一千?一萬(wàn)?還是更多?你知道其中存在多少個(gè)“僵尸粉”嗎?

近日,據(jù)美國(guó)權(quán)威科技媒體The Information引述研究機(jī)構(gòu)Ghost Data的報(bào)告稱,2015年,Instagram平臺(tái)的僵尸賬號(hào)占比為7.9%,到目前已經(jīng)攀升至9.5%。Instagram的閱讀用戶已經(jīng)增加到了十億人。根據(jù)上述比例,Instagram平臺(tái)上現(xiàn)在大約有9500萬(wàn)個(gè)僵尸賬號(hào)。

有媒體評(píng)論指出,如此規(guī)模的“僵尸賬號(hào)”,讓Instagram成為下一個(gè)互聯(lián)網(wǎng)行業(yè)打擊假新聞、假信息和政客營(yíng)銷的重要陣地。

為什么這么說(shuō) ,恐怕得看看“網(wǎng)絡(luò)水軍”在近些年的“杰作”。 2017 年,至少有 18 個(gè)國(guó)家在選舉中遭遇了線上操縱和虛假信息策略,包括德國(guó)聯(lián)邦總統(tǒng)選舉期間社交機(jī)器人活躍和垃圾新聞?lì)l出等。

顯然,治理“網(wǎng)絡(luò)水軍”已成為全球難題。而由于其分散、量大兼具技術(shù)隱蔽性,對(duì)其的治理更需要講究專業(yè)化和智能化。此時(shí),人工智能也派上了用處。

道高一尺,魔高一丈,虛假賬號(hào)與AI的斗智斗勇

從創(chuàng)建應(yīng)用軟件、官方網(wǎng)站或內(nèi)容傳播平臺(tái),到生產(chǎn)具有實(shí)質(zhì)性內(nèi)容的圖像、視頻或文字,通過(guò)或真或假或自動(dòng)地與用戶交互,虛假賬號(hào)已經(jīng)越來(lái)越“真實(shí)”。就在去年,有研究表明,連人工智能都可以被用來(lái)生成復(fù)雜的點(diǎn)評(píng)信息,而這些虛假的點(diǎn)評(píng)不僅機(jī)器無(wú)法檢測(cè)出來(lái),就連人類讀者也分辨不出來(lái)。

虛假賬號(hào)不再“虛假”,整個(gè)社交網(wǎng)站都面臨著潛在卻嚴(yán)重的沖擊。智能相對(duì)論(aixdlun)分析師顏璇梳理了三種智能“鑒粉”方式,分別囊括了用戶行為、內(nèi)容和情感特征三種形式,試圖解決這一問(wèn)題。

首先是用戶行為特征的分析。這種方式大多依托于爬蟲技術(shù),即通過(guò)主動(dòng)爬取特定微博或者論壇的主體相關(guān)的注冊(cè)行為、社交行為、轉(zhuǎn)發(fā)與評(píng)論等行為 , 從而進(jìn)行多維特征向量刻畫。同時(shí),有研究者還采用了隱馬爾可夫模型來(lái)對(duì)用戶行為進(jìn)行建模,利用模型參數(shù)來(lái)對(duì)用戶行為進(jìn)識(shí)別和分類,畢竟“僵尸”掉進(jìn)了“植物”里,總是有區(qū)別的。

這主要是利用賬號(hào)之間的社會(huì)關(guān)系來(lái)識(shí)別那些“僵尸號(hào)”。而面對(duì)這種方式,水軍們也“與時(shí)俱進(jìn)”,比如一些職業(yè)差評(píng)師的賬號(hào)在注冊(cè)行為上就無(wú)懈可擊,他們的賬號(hào)一般會(huì)同時(shí)配備有身份證、用戶手持證件照、實(shí)名手機(jī)號(hào)碼卡、實(shí)名銀行卡等,還能通過(guò)作弊軟件騙過(guò)實(shí)名認(rèn)證系統(tǒng)。即使是微博里的“僵尸粉”,也會(huì)存在一些粉絲關(guān)系。

第一種方式被“見(jiàn)招拆招”,AI也不得不拿出第二種方式,即對(duì)內(nèi)容特征的分析?;趦?nèi)容分析的識(shí)別技術(shù)主要從發(fā)帖內(nèi)容本身切入 ,建立“僵尸粉”、惡意或者美化信息等本體模型, 同時(shí)建立敏感語(yǔ)義庫(kù),通過(guò)語(yǔ)言特征統(tǒng)計(jì)區(qū)分虛假賬號(hào)。

但是,由于語(yǔ)義領(lǐng)域的不統(tǒng)一性,同一本體在不同領(lǐng)域,甚至同一領(lǐng)域都會(huì)存在很多象征意義的現(xiàn)狀,比如用戶在討論某手機(jī)時(shí),提到“這手機(jī)的上網(wǎng)速度真快”,“快”是一種夸贊,如果說(shuō)“這手機(jī)耗電速度真快”,“快”又變成了一種批評(píng)。因此,內(nèi)容特征模型在不同的情況、平臺(tái)上都會(huì)有較大的變化,這也造成了AI分析內(nèi)容特征進(jìn)而識(shí)別“僵尸粉”的通用性較差的問(wèn)題。

如此來(lái)看,基于單一特征對(duì)虛假賬號(hào)進(jìn)行識(shí)別還是比較困難的,因此,AI也不得不開始思考第三種方式。第三種方式源于第二種方式,即對(duì)內(nèi)容中情感特征的分析。

有研究者通過(guò)分析推特內(nèi)容中的情感,發(fā)現(xiàn)在線社交網(wǎng)絡(luò)中的內(nèi)容創(chuàng)建、傳播與證券市場(chǎng)波動(dòng)、期貨商品價(jià)格及國(guó)家、社會(huì)重大事件之間有著緊密的聯(lián)系。這也表明情感傾向是社交網(wǎng)站內(nèi)容中的重要特征。

而水軍也往往帶有強(qiáng)烈的感情色彩(好評(píng)或差評(píng)),針對(duì)單個(gè)發(fā)帖的情感傾向性,AI可以設(shè)定一個(gè)閾值,若對(duì)某個(gè)主題發(fā)表的正面或者負(fù)面帖子比例超過(guò)設(shè)定閾值,,則認(rèn)為該用戶為水軍。

但是,用于虛假賬號(hào)監(jiān)測(cè)的內(nèi)容和情感特征的融合,屬于比較明顯的特征,而忽視了隱藏式的異常用戶,比如用戶上傳與文字內(nèi)容沒(méi)有任何關(guān)系的圖片, 抑或者用戶評(píng)論情感與用戶打分不匹配等新特征。

當(dāng)網(wǎng)友對(duì)水軍開始麻木,活著的水軍其實(shí)已經(jīng)死了

事實(shí)上,網(wǎng)絡(luò)水軍要想操作輿論,只需要錯(cuò)開發(fā)帖時(shí)間、編輯同一核心的不同文字內(nèi)容就可以了,雖然這樣做的成本會(huì)高一點(diǎn),但是具體操作起來(lái)也不是什么高難度的事情。如果有人真心實(shí)意想要給某個(gè)作品一個(gè)差評(píng),人工智能還真不能立即判斷出他是真實(shí)用戶還是水軍。

那我們就拿這些虛假賬號(hào)沒(méi)辦法了嗎?

新浪微博里首個(gè)突破一億粉絲的女藝人,我們不會(huì)真的相信是有一億個(gè)人關(guān)注了她;一部好電影上映,眾口皆碑下也不會(huì)有人在意零星幾個(gè)差評(píng);百分百好評(píng)的商品,消費(fèi)者也會(huì)對(duì)其持有懷疑;疫苗事件后,網(wǎng)民對(duì)調(diào)查記者的呼喚,其實(shí)是一種自我保護(hù)……不得不說(shuō),中國(guó)的輿論形成和監(jiān)督機(jī)制正在翻新,水軍操縱輿情的力量也越來(lái)越弱。

以最近的疫苗事件為例,在事件剛爆發(fā)時(shí),也不乏一些別有用心的人,整理出一些兒童因疫苗殘疾的圖片,卻不做任何文字說(shuō)明,引起了許多人的恐慌和憤怒,但是筆者在其中還是發(fā)現(xiàn)了許多比較理性的言論,表明疫苗的不良反應(yīng)也是客觀存在的,這類危言聳聽的做法反而會(huì)阻礙健康疫苗在國(guó)內(nèi)的普及。

目前,網(wǎng)上對(duì)疫苗流向的追問(wèn),有關(guān)人員的責(zé)問(wèn),各種po文有理有據(jù),也是眾多網(wǎng)友理性思考后的結(jié)果。

所以,盡管虛假賬號(hào)的痕跡越來(lái)越隱蔽,但網(wǎng)民們的理性和成熟也在不斷加快,更多網(wǎng)民也不再盲目輕信,反而會(huì)批判式地去看待每一個(gè)輿論觀點(diǎn),從情緒化到更加理智,從感性到理性,社交軟件上的觀點(diǎn)已經(jīng)越來(lái)越多元化,網(wǎng)絡(luò)水軍也越來(lái)越難以左右輿論走向。

【完】

智能相對(duì)論(微信id:aixdlun):深挖人工智能這口井,評(píng)出咸淡,講出黑白,道出vb深淺。重點(diǎn)關(guān)注領(lǐng)域:AI+醫(yī)療、機(jī)器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開發(fā)者以及背后的芯片、算法、人機(jī)交互等。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-25
虛假賬號(hào)不斷進(jìn)化,AI能做的還是有限
原標(biāo)題:虛假賬號(hào)不斷進(jìn)化,AI能做的還是有限文 | 顏璇 來(lái)源 | 智能相對(duì)論(ID:aixdlun) 你的社交平臺(tái)擁有多少個(gè)粉絲? 一千?一萬(wàn)?還是更多?你知道其中存在多少個(gè)“僵尸粉”嗎? 近日,

長(zhǎng)按掃碼 閱讀全文