為什么第三方數(shù)據(jù)報告總是不準?

一到年底,就有各種第三方數(shù)據(jù)報告發(fā)布,呈現(xiàn)2018年互聯(lián)網(wǎng)行業(yè)的發(fā)展狀況,對2019年行業(yè)趨勢進行洞察,理論上來說,這樣的報告對于創(chuàng)業(yè)者、投資者、媒體都是重要的參考,也有利于企業(yè)了解行業(yè)和對手,對數(shù)據(jù)排名靠前的公司也是一種背書。

然而每一年我們都會發(fā)現(xiàn),不同數(shù)據(jù)報告出入很大,給人感覺有些云里霧里。不只是年度報告,“第三方報告不準”,多年來一直困擾著互聯(lián)網(wǎng)行業(yè),特別是互聯(lián)網(wǎng)企業(yè)。

為什么第三方數(shù)據(jù)報告總是不準?

第三方報告不準

近日看到兩份Trustdata的報告,其中一些數(shù)據(jù),就讓人費解。

在Trustdata1月10日發(fā)布的《2018年12月移動互聯(lián)網(wǎng)全行業(yè)排行榜》中,12月TOP200 App排行榜前10分別是:微信、QQ、支付寶、百度、wifi萬能鑰匙、淘寶、騰訊視頻、抖音、愛奇藝和QQ瀏覽器。

為什么第三方數(shù)據(jù)報告總是不準?

不過在其15天后發(fā)布的《2018年移動互聯(lián)網(wǎng)行業(yè)分析報告》中,2018年TOP20移動應用座次卻發(fā)生了變化,分別是:微信、支付寶、QQ、淘寶、百度、wifi萬能鑰匙、騰訊視頻、抖音、愛奇藝和QQ瀏覽器。支付寶超過了QQ,淘寶超過了百度和wifi萬能鑰匙。

為什么第三方數(shù)據(jù)報告總是不準?

會不會是第二份報告統(tǒng)計的是2018年全年數(shù)據(jù)?答案是否定的。Trustdata在報告中明確,采納的是2018年12月的數(shù)據(jù),相關(guān)App的MAU也發(fā)生了變化,有的甚至直接增加了兩億之多。

不只是數(shù)據(jù)前后有出入,關(guān)鍵指標與企業(yè)官方和其他第三方數(shù)據(jù)也不一樣。

騰訊2018年三季度財報顯示:QQ整體月活為8.026億,就移動端而言,QQ智能終端月活賬戶為6.979億。在Trustdata兩份報告中,QQ月活卻只有5.8億,會不會是QQ四季度大幅下滑了2億?答案是否定的,三季度QQ智能終端月活躍賬戶同比增長6.9%,年齡21歲以下的年輕用戶活躍用戶數(shù)和使用時間甚至還錄得增長,不可能出現(xiàn)這樣的斷崖式下滑。

如果說企業(yè)官方公布的數(shù)據(jù)不具備權(quán)威性,我們可以再看看別的第三方數(shù)據(jù)。QuestMobile的《中國互聯(lián)網(wǎng)2018年度大報告》在行業(yè)內(nèi)傳播最廣泛,它的App排行榜顯示,前十分別是:微信、QQ、支付寶、手機淘寶、愛奇藝、騰訊視頻、百度、抖音、搜狗輸入法和高德地圖,跟Trustdata有不少出入,其中QQ12月的MAU是6.49億,比TrustData的MAU多了近億,跟騰訊三季度財報的QQ智能終端月活6.979億非常接近。

我們再看手機數(shù)據(jù)。Trustdata第二份報告顯示,中國智能手機出貨量品牌占比,榮耀8.5%,小米12.6%,然而在賽諾的數(shù)據(jù)中,榮耀以5427萬臺銷量超越蘋果(5270萬臺)躋身中國市場TOP4,僅次于OPPO、vivo和華為。一份報告中,榮耀比小米強;另一份報告中,榮耀卻遠不如小米。

同一家數(shù)據(jù)機構(gòu)發(fā)布的不同報告,一個產(chǎn)品同一個時間的關(guān)鍵數(shù)據(jù)有巨大出入,確實很罕見。但不同報告中,一個產(chǎn)品的數(shù)據(jù)差異巨大的例子卻不勝枚舉?!暗谌齻€報告不準”的爭議,已經(jīng)成為企業(yè)和第三方數(shù)據(jù)機構(gòu)間的公開矛盾。

誤差太大企業(yè)不滿

在數(shù)據(jù)這件事情上,中國的數(shù)據(jù)機構(gòu)與企業(yè)之間,以及企業(yè)與企業(yè)之間一直都處于這樣的狀態(tài):一份報告出爐,某項指標第一、第二、第三之類的排序明確之后,企業(yè)要么會質(zhì)疑數(shù)據(jù)機構(gòu)統(tǒng)計數(shù)據(jù)的方法、結(jié)果或者動機,要么質(zhì)疑競爭對手與數(shù)據(jù)機構(gòu)“合作”進而導致數(shù)據(jù)不公平。

2016年張一鳴炮轟數(shù)據(jù)機構(gòu)艾瑞就曾引發(fā)行業(yè)爭議,艾瑞當時的數(shù)據(jù)顯示今日頭條日活用戶為“數(shù)百萬”,但今日頭條稱多家第三方數(shù)據(jù)機構(gòu)報告中其日活躍用戶數(shù)都超過三千萬。

令人印象深刻的案例還有UC瀏覽器和QQ瀏覽器之間的“數(shù)據(jù)之爭”,俞永福某次看到數(shù)據(jù)之后同樣表示震怒,拍桌子指責某數(shù)據(jù)機構(gòu)和騰訊,并找一堆媒體去澄清自己才是移動瀏覽器老大…這兩家關(guān)于誰是移動瀏覽器“老大”的爭奪,也持續(xù)了兩三年。

2016年高德與百度也一直在爭論究竟誰是互聯(lián)網(wǎng)地圖老大,高德甚至不斷喊話表示希望通過“嵌入第三方代碼”的方式一比高下;2017年,Trustdata發(fā)布《2017年上半年中國移動互聯(lián)網(wǎng)行業(yè)發(fā)展分析報告》中,關(guān)于“共享單車榜單易主,ofo登頂,摩拜呈現(xiàn)負增長”的結(jié)論,受到ofo質(zhì)疑,ofo與摩拜單車也有很長一段時間在爭,究竟誰是共享單車第一。

類似的爭議發(fā)生在搜索、電商、視頻、音樂、外賣諸多業(yè)務之中…如果一個領(lǐng)域沒有數(shù)據(jù)之爭,只有幾種可能:

  • 一是這個行業(yè)太小,數(shù)據(jù)機構(gòu)報告都不屑于出;
  • 二是這個行業(yè)定局了,比如從來沒有誰敢和微信來爭第一;
  • 三是這個行業(yè)不再景氣,共享單車、瀏覽器,現(xiàn)在就不爭了。

當然,只要涉及到排坐次,就很難讓所有人滿意。如果說數(shù)據(jù)差距本身就很大,自然不會引發(fā)爭議;如果說旗鼓相當,第三方數(shù)據(jù)機構(gòu)往往難以分清孰優(yōu)孰劣,如果一定要分清就會受到質(zhì)疑。第三方數(shù)據(jù)機構(gòu)就像球場上的裁判,有些球怎么吹都會挨罵。

不過,深層次來看,各大數(shù)據(jù)機構(gòu)總給人數(shù)據(jù)不準的感覺,還有更多原因。

為什么報告會不準?

這一點羅超頻道在《今日頭條PK艾瑞:數(shù)據(jù)機構(gòu)和企業(yè)為何總是爭論不休?》一文中已有分析,今天看來很多原因依然沒有得到解決,一些問題得到了解決。

第一、數(shù)據(jù)機構(gòu)的結(jié)果如何得來的本身不夠透明。

說某家公司市場份額這么多,使用時長這么多,是如何得出結(jié)論的?如果是抽樣調(diào)查,樣本選擇是否科學;如果是自動化工具,覆蓋用戶是否足夠大,原始數(shù)據(jù)和數(shù)據(jù)統(tǒng)計過程是否有漏洞…這些都是企業(yè)可能會質(zhì)疑的點,所以數(shù)據(jù)源來自哪里,如何統(tǒng)計的,統(tǒng)計過程都要足夠透明,經(jīng)得起第四方、第五方的檢驗才有說服力。

前些年第三方數(shù)據(jù)機構(gòu)公布報告,可能連數(shù)據(jù)源、統(tǒng)計方法都不會公布。如果監(jiān)督企業(yè)數(shù)據(jù)卻不公布自己的監(jiān)督方法顯然是不公平的。今天靠譜一點的報告基本都會公布統(tǒng)計方法和數(shù)據(jù)來源,如果不公布這些的報告,看看就好了。

第二,數(shù)據(jù)樣本很難覆蓋全量只能部分反映。

最了解一個App真實數(shù)據(jù)的,只有企業(yè)自己,第三方數(shù)據(jù)機構(gòu)只能通過各自的方法,獲取部分數(shù)據(jù)樣本,再應用統(tǒng)計學等方法去推測整體數(shù)據(jù),因此第三方數(shù)據(jù)只能不斷接近真實水平,卻不可能做到100%準確,數(shù)據(jù)獲取能力決定著一家機構(gòu)數(shù)據(jù)接近真實情況的能力。

不同機構(gòu)獲取數(shù)據(jù)方法不一。一些非主流數(shù)據(jù)機構(gòu)直接采取抽樣,甚至去應用市場爬下載量這樣的“笨方法”來做報告,基本已沒任何參考價值。主流數(shù)據(jù)機構(gòu)也有不同辦法,有的跟手機公司直接合作,有的跟運營商合作,有的給App提供技術(shù)服務順便拿到一些數(shù)據(jù),有的跟App合作,但不論哪種手段,都不能覆蓋全部數(shù)據(jù)。

相對PC網(wǎng)站的開放性而言,移動時代數(shù)據(jù)統(tǒng)計更難,App是一個封閉的體系,它自己最清楚自己的數(shù)據(jù),而且互聯(lián)網(wǎng)公司都將數(shù)據(jù)當成資產(chǎn),愈發(fā)不愿意公開數(shù)據(jù)給第三方,如果涉及到交易額之類的機密數(shù)據(jù)更是不可能公開。

正是因為此,第三方數(shù)據(jù)機構(gòu)的數(shù)據(jù),只有一定參考性,就像前文提到的TrustData,其在報告中表示,數(shù)據(jù)基礎(chǔ)是自建的“日活超過1億,月活超過3.2億”的安卓用戶樣本集,再根據(jù)網(wǎng)民人口結(jié)構(gòu)、地域分布、各移動應用iOS和安卓比例等因素建立模型計算所得,說白了還是統(tǒng)計學規(guī)則,既然是這樣,也只能盡量準確,不能做到絕對準確。

為什么第三方數(shù)據(jù)報告總是不準?

第三,就算能拿到樣本,誰能保證數(shù)據(jù)本身沒問題?

不論是手機公司還是運營商,給到第三方數(shù)據(jù)機構(gòu)的數(shù)據(jù)都是原始,需要進行去重、清洗、脫敏等等,這就要考量一個數(shù)據(jù)機構(gòu)的大數(shù)據(jù)挖掘能力。

在有能力處理拿到的數(shù)據(jù)后,還要對數(shù)據(jù)進行“脫水”,甚至“反刷”,舉個例子,如果一個第三方數(shù)據(jù)機構(gòu)采取與App合作讓后者接入自家SDK的方式來統(tǒng)計后者數(shù)據(jù),那么企業(yè)會不會去“做數(shù)據(jù)”,來欺騙對應的數(shù)據(jù)機構(gòu)?換句話說,如果數(shù)據(jù)機構(gòu)讓企業(yè)自己“上報”數(shù)據(jù),企業(yè)就會老老實實給數(shù)據(jù)嗎?不只是這樣的情況,如果一個報告很重要,企業(yè)又知道報告統(tǒng)計方法,就很可能會想方設(shè)法去把數(shù)據(jù)做得漂亮,從數(shù)據(jù)源頭造假,這基本上無解。

第四、不同機構(gòu)數(shù)據(jù)指標口徑嚴重不統(tǒng)一的問題。

前幾年互聯(lián)網(wǎng)公司合并的很多,經(jīng)常出現(xiàn)合并之后兩家公司市場份額加起來大于100%甚至200%的情況…這是因為之前兩家公司可能找了不同的數(shù)據(jù)機構(gòu)做報告,并且,這些報告采取了不同口徑:有的統(tǒng)計的是滲透率,有的是用戶市場份額,有的是活躍用戶份額…總之,五花八門的指標讓人眼花繚亂,精細化的統(tǒng)計并不是沒有必要,但很多時候數(shù)據(jù)機構(gòu)是為了給企業(yè)做一份能夠拿到“第一”的報告而努力設(shè)計對應的指標和口徑,結(jié)果就是,A企業(yè)用數(shù)學去跟B企業(yè)比語文,大家根本就不是在對比同一個指標。

數(shù)據(jù)不準的原因是多方面的,長期來看,數(shù)據(jù)只能盡量降低誤差,然而卻不能消除誤差。既然是這樣,是不是說,第三方數(shù)據(jù)報告沒價值呢?答案是否定的。

如何看待第三方報告?

首先,數(shù)據(jù)不說謊,真實的數(shù)據(jù)對于行業(yè)來說有很大的價值。

企業(yè)了解行業(yè)和對手,創(chuàng)業(yè)者尋找創(chuàng)新機會,投資者發(fā)現(xiàn)項目,媒體報道企業(yè),都要看數(shù)據(jù)。企業(yè)自己公布的數(shù)據(jù)不一定就是真實的,正是因為此,需要第三方數(shù)據(jù)機構(gòu)來作為參考。

因此,我們不能否認第三方數(shù)據(jù)機構(gòu)存在的價值,以及各種第三方報告的價值。

正是因為每一家數(shù)據(jù)機構(gòu)的報告都不是絕對準確,所以數(shù)據(jù)關(guān)注者應該綜合參考多家機構(gòu)的數(shù)據(jù)?,F(xiàn)在國內(nèi)互聯(lián)網(wǎng)行業(yè)比較主流的就有QuesMobile、APP Annie、艾瑞、trustdata、talking data,超級大公司也有自己的數(shù)據(jù)監(jiān)測平臺,比如騰訊燈塔、百度移動統(tǒng)計、阿里友盟等。

為什么第三方數(shù)據(jù)報告總是不準?

其次,機構(gòu)要自律,只有盡量讓數(shù)據(jù)接近真實水平才能走得遠。

現(xiàn)在數(shù)據(jù)機構(gòu)越來越多,如果你數(shù)據(jù)總是不靠譜,品牌沒了、數(shù)據(jù)就沒人信了,大家會選擇去相信有品牌的數(shù)據(jù)機構(gòu),QuestMobile就是最近兩年崛起的數(shù)據(jù)機構(gòu),不是因為數(shù)據(jù)100%準確,而是因為數(shù)據(jù)相對更加準確,口碑可以。

有一些機構(gòu)數(shù)據(jù)不準也與商業(yè)模式有關(guān)系,因此數(shù)據(jù)機構(gòu)要走出依賴報告本身的營收模式,而是探索類似于大數(shù)據(jù)服務、開發(fā)者服務、咨詢服務、數(shù)據(jù)媒體化等新的商業(yè)模式?,F(xiàn)在有的機構(gòu)的報告數(shù)據(jù)真正做到了絕對客觀,對數(shù)據(jù)本身敬畏,最終數(shù)據(jù)報告影響力就越來越大,所以每一次發(fā)報告,就可以成為品牌的廣告機會,進而形成商業(yè)模式。

為什么第三方數(shù)據(jù)報告總是不準?

最后,機構(gòu)要自強,拿到更多數(shù)據(jù)的同時強化大數(shù)據(jù)技術(shù)。

機構(gòu)要合法合理地獲取更多真實有效的樣本數(shù)據(jù),在移動時代特別是監(jiān)管部門限制對用戶數(shù)據(jù)獲取后,這會越來越難,正是因為此,數(shù)據(jù)機構(gòu)競爭會更激烈。

去年成功IPO,成為第三方數(shù)據(jù)服務商第一股的極光大數(shù)據(jù),就勝在了數(shù)據(jù)獲取能力上,其擁有開發(fā)者服務、廣告服務和數(shù)據(jù)服務三大產(chǎn)品體系,覆蓋極光推送JPush、極光IM、極光短信、極光統(tǒng)計、社會化分享,廣告服務(極光效果通)助力實現(xiàn)精準營銷,基于此可以與很多手機廠商合作交換數(shù)據(jù),跟App開發(fā)者(含iOS平臺)進行合作來搜集數(shù)據(jù),最終形成了較強的樣本數(shù)據(jù)覆蓋。

為什么第三方數(shù)據(jù)報告總是不準?

機構(gòu)還要不斷強化自己的數(shù)據(jù)挖掘技術(shù),應用日益成熟的AI、IoT等技術(shù)對數(shù)據(jù)進行廣泛獲取、深入洞察和價值挖掘,為行業(yè)創(chuàng)造價值。在我看來區(qū)塊鏈技術(shù)的普及,也有望解決企業(yè)與機構(gòu)間數(shù)據(jù)共享的矛盾,因為區(qū)塊鏈的一大優(yōu)勢就是可以在保護隱私的同時進行數(shù)據(jù)分享應用。

大數(shù)據(jù)時代,我認為只有在數(shù)據(jù)和技術(shù)上形成核心競爭力的數(shù)據(jù)機構(gòu),才能走得更遠。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-01-27
為什么第三方數(shù)據(jù)報告總是不準?
一到年底,就有各種第三方數(shù)據(jù)報告發(fā)布,呈現(xiàn)2018年互聯(lián)網(wǎng)行業(yè)的發(fā)展狀況。

長按掃碼 閱讀全文