?西班牙、英格蘭連續(xù)兩場失利,小組賽即遭淘汰,不僅讓一些球迷傷心欲絕,讓彩民損失不小,還順便連累了眾多預(yù)測世界杯的高人欲哭無淚。
這屆世界杯在大數(shù)據(jù)火爆之后,不管是民間還是官方,都把大數(shù)據(jù)的概念運(yùn)用到了世界杯預(yù)測上,但這些預(yù)測真的準(zhǔn)嗎?下面選取國內(nèi)外主要的八種世界杯預(yù)測,對他們的預(yù)測方法進(jìn)行簡要的分析,看看誰的更準(zhǔn)一些。
百度分析最傳統(tǒng)
據(jù)驗(yàn)證,今年全國高考作文題目18卷中12卷的作文方向被百度大數(shù)據(jù)預(yù)測命中,被戲稱“神預(yù)測”。因此,這次百度收集網(wǎng)上的綜合數(shù)據(jù),然后進(jìn)行整理、分析,最終通過大規(guī)模機(jī)器學(xué)習(xí)等人工智能技術(shù),開始預(yù)測世界杯。
百度大數(shù)據(jù)研究院利用百度大數(shù)據(jù)全面搜索過去5年內(nèi)全世界987支球隊(duì)的3.7萬場比賽數(shù)據(jù),并與國內(nèi)著名彩票網(wǎng)站樂彩網(wǎng)、歐洲必發(fā)指數(shù)獨(dú)家數(shù)據(jù)供應(yīng)商Spdex等公司建立數(shù)據(jù)戰(zhàn)略合作伙伴關(guān)系,將博彩市場數(shù)據(jù)融入到預(yù)測模型中,構(gòu)建了本次“世界杯預(yù)測”產(chǎn)品的足球賽事預(yù)測模型。該模型共涉及到19972名球員和1.12億條相關(guān)數(shù)據(jù),所參考的數(shù)據(jù)包括百度搜索數(shù)據(jù)、球隊(duì)基礎(chǔ)數(shù)據(jù)、球員基礎(chǔ)數(shù)據(jù)、賠率市場數(shù)據(jù)等,所分析的球隊(duì)不僅包括207支國家隊(duì),還囊括了歐洲、南美、亞洲等聯(lián)賽俱樂部及低級別球隊(duì)信息。
評:百度用的是傳統(tǒng)的統(tǒng)計(jì)分析,注重近期球隊(duì)和球員表現(xiàn),這種預(yù)測是至今為止在技術(shù)上最穩(wěn)定的方法,但受意外因素(如天氣、傷病、裁判等)影響較大。到現(xiàn)在為止,百度成功預(yù)測對了智利的黑馬本色,卻遺漏了哥斯達(dá)黎加。
德銀推算最胡鬧
德銀根據(jù)各個球隊(duì)的FIFA排名、歷史戰(zhàn)績、球員構(gòu)成和賭場賠率等因素,建立了量化分析模型,并根據(jù)復(fù)雜計(jì)算得到一份奪冠概率表格,從奪冠概率表格中挑選出了前10強(qiáng),依據(jù)“輪流轉(zhuǎn)周期”,由此排除了2014年巴西、意大利和西班牙奪冠的可能性,然后根據(jù)另一個假設(shè):強(qiáng)隊(duì)會回來,即奪取過世界杯的強(qiáng)隊(duì),未來必然還會奪取世界杯或至少打入一次決賽。最后,本屆英格蘭隊(duì)有6名隊(duì)員來自利物浦,而正是在利物浦的球員最多的1966年,英格蘭獲得了歷史上唯一一次世界杯冠軍。同時,德銀報告的主筆人承認(rèn)自己是利物浦隊(duì)的鐵桿球迷,因此,最后確定英格蘭將獲得世界杯的冠軍。
評:還好,德銀報告主筆不是中國隊(duì)的球迷!
高盛模型最神秘
高盛對世界杯決賽周32支國家隊(duì)的勝算,有它自己的一套評估方法(命名Elo),在所有因素中分量最重。Elo是高盛自設(shè)的動態(tài)系統(tǒng),不斷根據(jù)球隊(duì)近績更新評分和排名。
為此,分析師要收集來多項(xiàng)數(shù)據(jù),包括:世界各個國家足球隊(duì)歷史成績數(shù)據(jù)庫給出的各隊(duì)排名得分;比賽中雙方球隊(duì)過去10場和5場比賽的進(jìn)球數(shù);比賽雙方是不是巴西主場;比賽球隊(duì)是不是美洲球隊(duì);還有以往各隊(duì)在世界杯的進(jìn)球數(shù)優(yōu)于平時多少個。最后,他們把這幾項(xiàng)數(shù)據(jù)按照一定的權(quán)重相加到一起,可以得出每一個球隊(duì)在對陣另外某一個球隊(duì)時平均會進(jìn)多少個球。按照這樣的方式,從小組賽一路到最后決賽,每一場比賽雙方的進(jìn)球數(shù)都可以期望一番,最后獲得一個“最平均”的世界杯全程模擬結(jié)果。
評:投行一貫的神秘模型來忽悠投資者,Elo模型就是高深黑洞,關(guān)鍵環(huán)節(jié)恕不奉告,至于準(zhǔn)確與否,只有神知道。
嚴(yán)格的講,以上幾家的世界杯預(yù)測都不能算“大數(shù)據(jù)分析”,只是傳統(tǒng)的統(tǒng)計(jì)分析,雖然數(shù)據(jù)“大”,但并未融合多種因素綜合考慮,可見在專業(yè)領(lǐng)域還是相信經(jīng)典理論。
霍金想法最娛樂
霍金收集了大量的數(shù)據(jù),包括歷史記錄、溫度、球場的海拔高度等,把所有數(shù)據(jù)都集中起來,分析你事先不知道的事情,或許能發(fā)現(xiàn)一些規(guī)律。它的原理不是傳統(tǒng)的分析,更多的是基于關(guān)系的一種預(yù)測?;艚?9頁的分析結(jié)果是關(guān)于如何提高英格蘭隊(duì)的奪冠幾率,但最后卻拋出一個讓英格蘭球迷傷心的終極結(jié)論:個人更看好巴西隊(duì)奪冠?;艚鹫J(rèn)為英格蘭隊(duì)首先需要在海拔500米以下的球場比賽,氣溫的提升會降低贏球可能,在巴西當(dāng)?shù)貢r間15時是最好的比賽時間。從球隊(duì)自身來說,433陣型無疑是奪冠的節(jié)奏,而且必須穿上紅色戰(zhàn)袍。提到點(diǎn)球大戰(zhàn),霍金認(rèn)為助跑必須不少于三步,如果速度上不去,進(jìn)球幾率只有58%。瞄準(zhǔn)上角的點(diǎn)球有84%的命中率,金發(fā)和禿頭的球員射中的概率達(dá)到更高的84%,前鋒的進(jìn)球概率超過80%,中場與后衛(wèi)遞減。
評:霍金老爺爺最近幾年很喜歡預(yù)測,還預(yù)測過世界將在兩百年之后滅亡,這次娛樂世界杯一下,也算是比黑洞要沾地氣。如果預(yù)測對了,建議用這個理由把早就該屬于霍金的諾貝爾獎發(fā)了吧。
科隆體育最繁瑣
德國科隆體育學(xué)院根據(jù)復(fù)雜的計(jì)算機(jī)模擬測算得出的本屆世界杯預(yù)測結(jié)果:科隆體育學(xué)院的格羅爾教授領(lǐng)導(dǎo)研究小組以自己設(shè)計(jì)的計(jì)算機(jī)模擬算式一共進(jìn)行了10萬次測算,綜合考慮各隊(duì)的世界排名、足彩賠率、市值、預(yù)選賽表現(xiàn),還包括可能的傷病、戰(zhàn)術(shù)、氣候條件、主場優(yōu)勢因素。他們預(yù)測,巴西隊(duì)與阿根廷隊(duì)將爭冠,衛(wèi)冕冠軍西班牙有可能止步小組賽,從西荷大戰(zhàn)那個驚悚的5比1賽果,看來德國人的模擬測算還有靠譜的。
評:德國人的嚴(yán)謹(jǐn)是出了名的,而且竟然沒有預(yù)測德國奪冠,對于西班牙卻一語中的,估計(jì)他們現(xiàn)在都在祈禱決賽的預(yù)測是錯誤的,否則作為物理學(xué)家的默克爾總理不會答應(yīng)。
熊貓預(yù)測夭折了
世界杯開幕前,據(jù)媒體報道,中國保護(hù)大熊貓研究中心稱將派出一到兩歲的熊貓寶寶來預(yù)測世界杯。小組賽階段,主辦方會拿出三個竹筐代表主隊(duì)的勝平負(fù),熊貓寶寶則通過選擇哪個筐里的食物來預(yù)測比賽結(jié)果。等到了淘汰賽,熊貓寶寶們還會通過爬樹和賽跑來預(yù)測結(jié)果。前者是讓熊貓爬上掛有一方球隊(duì)國旗的樹木來預(yù)測,后者則是兩個熊貓寶寶分別穿上兩隊(duì)球衣,通過誰先跑到目的地來預(yù)測比賽結(jié)果。就在世界杯開賽之后,“熊貓預(yù)測世界杯”活動已經(jīng)被取消。
評:本來要頂替章魚保羅的國寶沒了用武之地,國人還是缺乏點(diǎn)娛樂精神,借此機(jī)會宣傳下大熊貓,有何不可,萬一要是預(yù)測對了,那大熊貓基地豈不成了大師圣地,還愁旅游不火?
微軟相信EXCEL
微軟必應(yīng)大數(shù)據(jù)之前曾多次成功預(yù)測奧斯卡獎項(xiàng)、投票大選。微軟的預(yù)測考慮過往比賽歷史、主場客場、地理位置、草坪狀況、天氣以及“群眾智慧”等等多種因素,還使用大量的公開數(shù)據(jù)——博彩市場、民意調(diào)查、社交媒體以及其它在線數(shù)據(jù),利用大數(shù)據(jù)分析來判斷每場比賽的結(jié)果。據(jù)說這一切都是用EXCEL來完成的,我們權(quán)當(dāng)其是軟件推廣策劃吧。
微軟:相信EXCEL是萬能的,但預(yù)測足球估計(jì)是萬萬不能的,不過,人家說奧斯卡、大選都預(yù)測對了,還是看結(jié)果吧。
雅虎相信網(wǎng)絡(luò)流言
雅虎用輕博客網(wǎng)站Tumblr的數(shù)據(jù)來估計(jì)每支國家隊(duì)的優(yōu)勢,最終計(jì)算出最可能獲勝的是巴西。雅虎研究小組分析的前提是,Tumblr上所有有關(guān)世界杯的討論都具有一定價值。為了查明哪些國家將相互較量,小組會根據(jù)之前比賽的結(jié)果為每支隊(duì)伍賦予優(yōu)勢值。針對每一次比賽,雅虎會利用名為泊松分布不同參數(shù)的概率論來估計(jì)每一支隊(duì)伍可能的進(jìn)球數(shù)量。
評:雅虎相信的是目前最火的社交網(wǎng)絡(luò)數(shù)據(jù),據(jù)說可以預(yù)測傳染病和犯罪現(xiàn)場,不知道對足球是否有效?
(據(jù)說美女主持穿什么球衣,什么球隊(duì)就輸球,而美女的球衣選擇是靠網(wǎng)民投票出來的,所以,也證明了冷門太多)
當(dāng)然,雖然很多人相信大數(shù)據(jù)能夠幫助我們預(yù)測世界杯,也有不可預(yù)測派。美國的洛斯·阿拉莫斯國家實(shí)驗(yàn)室的三位統(tǒng)計(jì)物理學(xué)家曾經(jīng)對大型體育比賽的賽況進(jìn)行數(shù)據(jù)化分析,發(fā)現(xiàn)在棒球、曲棍球、籃球、橄欖球以及足球五大項(xiàng)目中,足球比賽是其中最具懸念,賽果最具不確定性的,弱旅戰(zhàn)勝強(qiáng)隊(duì)的概率居高不下,即使使用科學(xué)方法也未能得到準(zhǔn)確的預(yù)測。
說實(shí)話,作為統(tǒng)計(jì)專業(yè)人士,對足球預(yù)測不敢太相信,體育比賽確實(shí)可以預(yù)測,足球也不例外,但足球項(xiàng)目影響因素太多,特別是世界杯足球比賽相對場次不多、間隔周期太長,致使數(shù)據(jù)量很小,比賽中又有太多的主觀因素(比如裁判),有時候這種比賽的預(yù)測和算命沒什么差別。
如果要問為何總有人預(yù)測正確?正如一家報紙所說,每屆世界杯都會有無數(shù)的“保羅”,大部分都在前幾次猜測失敗后從媒體視線中消失。貝利也不是真正的烏鴉嘴,只不過他預(yù)測成功的時候沒有后續(xù)報道。預(yù)測大師都是這樣練成的!
【首發(fā)于百度百家,未經(jīng)許可謝絕轉(zhuǎn)載,溝通交流請 @馬繼華 或加公眾號“北國騎士”】
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。