123,123,123

原標(biāo)題：虛假賬號不斷進化，AI能做的還是有限

文 | 顏璇

來源 | 智能相對論（ID：aixdlun）

你的社交平臺擁有多少個粉絲？

一千？一萬？還是更多？你知道其中存在多少個“僵尸粉”嗎？

近日，據(jù)美國權(quán)威科技媒體The Information引述研究機構(gòu)Ghost Data的報告稱，2015年，Instagram平臺的僵尸賬號占比為7.9%，到目前已經(jīng)攀升至9.5%。Instagram的閱讀用戶已經(jīng)增加到了十億人。根據(jù)上述比例，Instagram平臺上現(xiàn)在大約有9500萬個僵尸賬號。

有媒體評論指出，如此規(guī)模的“僵尸賬號”，讓Instagram成為下一個互聯(lián)網(wǎng)行業(yè)打擊假新聞、假信息和政客營銷的重要陣地。

為什么這么說，恐怕得看看“網(wǎng)絡(luò)水軍”在近些年的“杰作”。 2017 年，至少有 18 個國家在選舉中遭遇了線上操縱和虛假信息策略，包括德國聯(lián)邦總統(tǒng)選舉期間社交機器人活躍和垃圾新聞頻出等。

顯然，治理“網(wǎng)絡(luò)水軍”已成為全球難題。而由于其分散、量大兼具技術(shù)隱蔽性，對其的治理更需要講究專業(yè)化和智能化。此時，人工智能也派上了用處。

道高一尺，魔高一丈，虛假賬號與AI的斗智斗勇

從創(chuàng)建應(yīng)用軟件、官方網(wǎng)站或內(nèi)容傳播平臺，到生產(chǎn)具有實質(zhì)性內(nèi)容的圖像、視頻或文字，通過或真或假或自動地與用戶交互，虛假賬號已經(jīng)越來越“真實”。就在去年，有研究表明，連人工智能都可以被用來生成復(fù)雜的點評信息，而這些虛假的點評不僅機器無法檢測出來，就連人類讀者也分辨不出來。

虛假賬號不再“虛假”，整個社交網(wǎng)站都面臨著潛在卻嚴(yán)重的沖擊。智能相對論（aixdlun）分析師顏璇梳理了三種智能“鑒粉”方式，分別囊括了用戶行為、內(nèi)容和情感特征三種形式，試圖解決這一問題。

首先是用戶行為特征的分析。這種方式大多依托于爬蟲技術(shù)，即通過主動爬取特定微博或者論壇的主體相關(guān)的注冊行為、社交行為、轉(zhuǎn)發(fā)與評論等行為 , 從而進行多維特征向量刻畫。同時，有研究者還采用了隱馬爾可夫模型來對用戶行為進行建模，利用模型參數(shù)來對用戶行為進識別和分類，畢竟“僵尸”掉進了“植物”里，總是有區(qū)別的。

這主要是利用賬號之間的社會關(guān)系來識別那些“僵尸號”。而面對這種方式，水軍們也“與時俱進”，比如一些職業(yè)差評師的賬號在注冊行為上就無懈可擊，他們的賬號一般會同時配備有身份證、用戶手持證件照、實名手機號碼卡、實名銀行卡等，還能通過作弊軟件騙過實名認(rèn)證系統(tǒng)。即使是微博里的“僵尸粉”，也會存在一些粉絲關(guān)系。

第一種方式被“見招拆招”，AI也不得不拿出第二種方式，即對內(nèi)容特征的分析?；趦?nèi)容分析的識別技術(shù)主要從發(fā)帖內(nèi)容本身切入 ,建立“僵尸粉”、惡意或者美化信息等本體模型, 同時建立敏感語義庫，通過語言特征統(tǒng)計區(qū)分虛假賬號。

但是，由于語義領(lǐng)域的不統(tǒng)一性，同一本體在不同領(lǐng)域，甚至同一領(lǐng)域都會存在很多象征意義的現(xiàn)狀，比如用戶在討論某手機時，提到“這手機的上網(wǎng)速度真快”，“快”是一種夸贊，如果說“這手機耗電速度真快”，“快”又變成了一種批評。因此，內(nèi)容特征模型在不同的情況、平臺上都會有較大的變化，這也造成了AI分析內(nèi)容特征進而識別“僵尸粉”的通用性較差的問題。

如此來看，基于單一特征對虛假賬號進行識別還是比較困難的，因此，AI也不得不開始思考第三種方式。第三種方式源于第二種方式，即對內(nèi)容中情感特征的分析。

有研究者通過分析推特內(nèi)容中的情感，發(fā)現(xiàn)在線社交網(wǎng)絡(luò)中的內(nèi)容創(chuàng)建、傳播與證券市場波動、期貨商品價格及國家、社會重大事件之間有著緊密的聯(lián)系。這也表明情感傾向是社交網(wǎng)站內(nèi)容中的重要特征。

而水軍也往往帶有強烈的感情色彩（好評或差評），針對單個發(fā)帖的情感傾向性，AI可以設(shè)定一個閾值，若對某個主題發(fā)表的正面或者負(fù)面帖子比例超過設(shè)定閾值,，則認(rèn)為該用戶為水軍。

但是，用于虛假賬號監(jiān)測的內(nèi)容和情感特征的融合，屬于比較明顯的特征，而忽視了隱藏式的異常用戶，比如用戶上傳與文字內(nèi)容沒有任何關(guān)系的圖片，抑或者用戶評論情感與用戶打分不匹配等新特征。

當(dāng)網(wǎng)友對水軍開始麻木，活著的水軍其實已經(jīng)死了

事實上，網(wǎng)絡(luò)水軍要想操作輿論，只需要錯開發(fā)帖時間、編輯同一核心的不同文字內(nèi)容就可以了，雖然這樣做的成本會高一點，但是具體操作起來也不是什么高難度的事情。如果有人真心實意想要給某個作品一個差評，人工智能還真不能立即判斷出他是真實用戶還是水軍。

那我們就拿這些虛假賬號沒辦法了嗎？

新浪微博里首個突破一億粉絲的女藝人，我們不會真的相信是有一億個人關(guān)注了她；一部好電影上映，眾口皆碑下也不會有人在意零星幾個差評；百分百好評的商品，消費者也會對其持有懷疑；疫苗事件后，網(wǎng)民對調(diào)查記者的呼喚，其實是一種自我保護……不得不說，中國的輿論形成和監(jiān)督機制正在翻新，水軍操縱輿情的力量也越來越弱。

以最近的疫苗事件為例，在事件剛爆發(fā)時，也不乏一些別有用心的人，整理出一些兒童因疫苗殘疾的圖片，卻不做任何文字說明，引起了許多人的恐慌和憤怒，但是筆者在其中還是發(fā)現(xiàn)了許多比較理性的言論，表明疫苗的不良反應(yīng)也是客觀存在的，這類危言聳聽的做法反而會阻礙健康疫苗在國內(nèi)的普及。

目前，網(wǎng)上對疫苗流向的追問，有關(guān)人員的責(zé)問，各種po文有理有據(jù)，也是眾多網(wǎng)友理性思考后的結(jié)果。

所以，盡管虛假賬號的痕跡越來越隱蔽，但網(wǎng)民們的理性和成熟也在不斷加快，更多網(wǎng)民也不再盲目輕信，反而會批判式地去看待每一個輿論觀點，從情緒化到更加理智，從感性到理性，社交軟件上的觀點已經(jīng)越來越多元化，網(wǎng)絡(luò)水軍也越來越難以左右輿論走向。

【完】

智能相對論（微信id:aixdlun）：深挖人工智能這口井，評出咸淡，講出黑白，道出vb深淺。重點關(guān)注領(lǐng)域：AI+醫(yī)療、機器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開發(fā)者以及背后的芯片、算法、人機交互等。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

虛假賬號不斷進化，AI能做的還是有限

下一篇

虛假賬號不斷進化，AI能做的還是有限