10月19日,為期5天的第28屆國(guó)際計(jì)算機(jī)信息與知識(shí)管理大會(huì)(ACM CIKM 2020)在線(xiàn)上召開(kāi)。匯量科技(Mobvista)將應(yīng)邀出席本次大會(huì),并將在10月22日“Applied Research Track Advertising I”環(huán)節(jié)分享其在移動(dòng)廣告反作弊領(lǐng)域的最新研究成果。
ACM CIKM是信息檢索和數(shù)據(jù)挖掘領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議之一,本屆CIKM會(huì)議共收到投稿920篇,其中錄用論文193篇,Mobvista反作弊團(tuán)隊(duì)的論文“BotSpot: A Hybrid Learning Framework to Uncover Bot Install Fraud in Mobile Advertising” 已于此前被本次大會(huì)錄用。該論文顯示, Mobvista反作弊團(tuán)隊(duì)研究并實(shí)現(xiàn)了一種新型的Bots安裝作弊檢測(cè)模型——BotSpot,并取得了不錯(cuò)的實(shí)際應(yīng)用效果。
近年來(lái),隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展以及智能移動(dòng)設(shè)備的興起和不斷普及,移動(dòng)廣告行業(yè)迅速發(fā)展。 據(jù)eMarketer報(bào)告顯示,2019 年全球移動(dòng)廣告總支出已高達(dá)2409.5億美元,預(yù)計(jì)2020年將持續(xù)增長(zhǎng)至2865億美元。然而,隨著移動(dòng)廣告預(yù)算的持續(xù)增長(zhǎng),移動(dòng)應(yīng)用安裝作弊也日漸猖狂,給廣告主造成了廣告預(yù)算浪費(fèi)的同時(shí),也對(duì)廣告平臺(tái)投放效果和聲譽(yù)造成了嚴(yán)重的不良影響。
在所有移動(dòng)應(yīng)用安裝的各種作弊類(lèi)型當(dāng)中, Bots安裝作弊無(wú)疑是當(dāng)前最難識(shí)別的,同時(shí)也是占比較大的一種作弊類(lèi)型。 根據(jù)AppsFlyer在2019年的一份報(bào)告顯示, AppsFlyer在2017年至2019年三年期間檢測(cè)到超過(guò)16億次安裝作弊,其中Bots安裝作弊高達(dá)9億多次。
Bots安裝作弊,是指作弊者通過(guò) Bots來(lái)模擬真實(shí)用戶(hù)的應(yīng)用安裝行為,從而竊取廣告主的廣告預(yù)算。Bots安裝作弊之所以難以檢測(cè)是因?yàn)锽ots看起來(lái)很像真實(shí)用戶(hù),它具有真實(shí)的IP、Device等,甚至可以進(jìn)行應(yīng)用內(nèi)的事件,如:在指定時(shí)間打開(kāi)應(yīng)用,加購(gòu)等。
目前,許多基于機(jī)器學(xué)習(xí)的移動(dòng)廣告作弊檢測(cè)方法都旨在解決廣告展現(xiàn)或點(diǎn)擊作弊問(wèn)題,但很少有關(guān)于安裝作弊檢測(cè),尤其是Bots安裝作弊檢測(cè)的研究。Mobvista集團(tuán)副總裁朱亞?wèn)|博士介紹,當(dāng)下的許多方法都采用了集成方法等技術(shù),例如:Random Forest和XGBoost等,盡管這些方法能夠通過(guò)復(fù)雜的特征工程挖掘出豐富的作弊模式,但由于它們無(wú)法利用結(jié)構(gòu)信息來(lái)構(gòu)建實(shí)體之間的各類(lèi)關(guān)系,因此這些方法并非最好的解決方案。
在此背景下,Mobvista反作弊團(tuán)隊(duì)提出了一種混式學(xué)習(xí)方法,該方法結(jié)合了神經(jīng)網(wǎng)絡(luò)(GNN)和梯度提升分類(lèi)器,能夠同時(shí)考慮局部上下文信息和全局上下文信息,以此來(lái)更好地檢測(cè)移動(dòng)廣告中的Bots安裝作弊。該團(tuán)隊(duì)并未直接利用現(xiàn)有的GNN模型,而是根據(jù)Mobvista的具體業(yè)務(wù)和Bots安裝作弊的特點(diǎn)構(gòu)建一個(gè)異構(gòu)圖并設(shè)計(jì)了一種新穎的消息傳遞機(jī)制來(lái)提取局部上下文信息;以及通過(guò)一個(gè)Pre-trained的梯度提升分類(lèi)器模型來(lái)提取全局上下文信息。 BotSpot模型的架構(gòu)如下圖所示:
通過(guò)在Mobvista上對(duì)真實(shí)數(shù)據(jù)進(jìn)行的實(shí)驗(yàn)結(jié)果顯示,BotSpot模型在檢測(cè)Bots安裝作弊方面具有更大的優(yōu)越性。在指定精確率(Precision)為90%的情況下,BotSpot模型在兩個(gè)離線(xiàn)數(shù)據(jù)集上相比所有其它Baseline方法在召回率(Recall)方面分別提高至少2.2%和5.75%。
作為全球領(lǐng)先的技術(shù)平臺(tái),在Mobvista每天有超過(guò)100萬(wàn)次應(yīng)用安裝,因此Mobvista十分重視對(duì)各類(lèi)移動(dòng)應(yīng)用安裝作弊手段的研究,以防廣告主的預(yù)算在沒(méi)有任何實(shí)際轉(zhuǎn)換的情況下被浪費(fèi)。值得一提的是,今年5月份,Mobvista針對(duì)移動(dòng)廣告作弊問(wèn)題,還發(fā)布了《移動(dòng)廣告反作弊白皮書(shū)2.0》,詳細(xì)闡述了當(dāng)前的移動(dòng)廣告領(lǐng)域的作弊情況、作弊方式及相應(yīng)的反作弊策略等。
朱亞?wèn)|博士表示,研究移動(dòng)廣告領(lǐng)域的Bots安裝作弊檢測(cè)問(wèn)題,是增強(qiáng)移動(dòng)廣告行業(yè)的透明度并推動(dòng)行業(yè)規(guī)范化發(fā)展的關(guān)鍵,然而目前卻鮮少有機(jī)構(gòu)針對(duì)該領(lǐng)域進(jìn)行研究,Mobvista始終站在移動(dòng)廣告反作弊攻防這一戰(zhàn)場(chǎng)的最前線(xiàn),希望通過(guò)此次論文的分享,能夠?yàn)樾袠I(yè)帶來(lái)更多的思考。
公開(kāi)資料顯示,Mobvista成立于2013年,目前已覆蓋全球超85個(gè)國(guó)家,在全球18個(gè)城市設(shè)有辦事處,為全球超過(guò)3000個(gè)應(yīng)用開(kāi)發(fā)者提供移動(dòng)廣告推廣服務(wù),且在其700多名員工中,有超過(guò)45%為技術(shù)研發(fā)人員。本次被CIKM錄用的論文,是在集團(tuán)副總裁朱亞?wèn)|指導(dǎo)下完成,并得到了中山大學(xué)梁上松教授的指點(diǎn)和幫助。10月22日,Mobvista高級(jí)算法工程師姚天峻及資深算法工程師李青也將代表反作弊團(tuán)隊(duì)在CIKM大會(huì)上進(jìn)行該成果的詳細(xì)分享,敬請(qǐng)期待。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )