您好,歡迎來到58網站目錄!
當前位置:58網站目錄 » 站長資訊 » 互聯(lián)網 » 互聯(lián)網新聞 » 文章詳細

大數(shù)據(jù)預測世界杯 八種方法誰靠譜

站長「蝙蝠俠」:QQ1251270088  瀏覽:1088次 時間:2014-06-21

?西班牙、英格蘭連續(xù)兩場失利,小組賽即遭淘汰,不僅讓一些球迷傷心欲絕,讓彩民損失不小,還順便連累了眾多預測世界杯的高人欲哭無淚。


這屆世界杯在大數(shù)據(jù)火爆之后,不管是民間還是官方,都把大數(shù)據(jù)的概念運用到了世界杯預測上,但這些預測真的準嗎?下面選取國內外主要的八種世界杯預測,對他們的預測方法進行簡要的分析,看看誰的更準一些。


百度分析最傳統(tǒng)


據(jù)驗證,今年全國高考作文題目18卷中12卷的作文方向被百度大數(shù)據(jù)預測命中,被戲稱“神預測”。因此,這次百度收集網上的綜合數(shù)據(jù),然后進行整理、分析,最終通過大規(guī)模機器學習等人工智能技術,開始預測世界杯。


百度大數(shù)據(jù)研究院利用百度大數(shù)據(jù)全面搜索過去5年內全世界987支球隊的3.7萬場比賽數(shù)據(jù),并與國內著名彩票網站樂彩網、歐洲必發(fā)指數(shù)獨家數(shù)據(jù)供應商Spdex等公司建立數(shù)據(jù)戰(zhàn)略合作伙伴關系,將博彩市場數(shù)據(jù)融入到預測模型中,構建了本次“世界杯預測”產品的足球賽事預測模型。該模型共涉及到19972名球員和1.12億條相關數(shù)據(jù),所參考的數(shù)據(jù)包括百度搜索數(shù)據(jù)、球隊基礎數(shù)據(jù)、球員基礎數(shù)據(jù)、賠率市場數(shù)據(jù)等,所分析的球隊不僅包括207支國家隊,還囊括了歐洲、南美、亞洲等聯(lián)賽俱樂部及低級別球隊信息。


評:百度用的是傳統(tǒng)的統(tǒng)計分析,注重近期球隊和球員表現(xiàn),這種預測是至今為止在技術上最穩(wěn)定的方法,但受意外因素(如天氣、傷病、裁判等)影響較大。到現(xiàn)在為止,百度成功預測對了智利的黑馬本色,卻遺漏了哥斯達黎加。




德銀推算最胡鬧

德銀根據(jù)各個球隊的FIFA排名、歷史戰(zhàn)績、球員構成和賭場賠率等因素,建立了量化分析模型,并根據(jù)復雜計算得到一份奪冠概率表格,從奪冠概率表格中挑選出了前10強,依據(jù)“輪流轉周期”,由此排除了2014年巴西、意大利和西班牙奪冠的可能性,然后根據(jù)另一個假設:強隊會回來,即奪取過世界杯的強隊,未來必然還會奪取世界杯或至少打入一次決賽。最后,本屆英格蘭隊有6名隊員來自利物浦,而正是在利物浦的球員最多的1966年,英格蘭獲得了歷史上唯一一次世界杯冠軍。同時,德銀報告的主筆人承認自己是利物浦隊的鐵桿球迷,因此,最后確定英格蘭將獲得世界杯的冠軍。

評:還好,德銀報告主筆不是中國隊的球迷!

高盛模型最神秘

高盛對世界杯決賽周32支國家隊的勝算,有它自己的一套評估方法(命名Elo),在所有因素中分量最重。Elo是高盛自設的動態(tài)系統(tǒng),不斷根據(jù)球隊近績更新評分和排名。

為此,分析師要收集來多項數(shù)據(jù),包括:世界各個國家足球隊歷史成績數(shù)據(jù)庫給出的各隊排名得分;比賽中雙方球隊過去10場和5場比賽的進球數(shù);比賽雙方是不是巴西主場;比賽球隊是不是美洲球隊;還有以往各隊在世界杯的進球數(shù)優(yōu)于平時多少個。最后,他們把這幾項數(shù)據(jù)按照一定的權重相加到一起,可以得出每一個球隊在對陣另外某一個球隊時平均會進多少個球。按照這樣的方式,從小組賽一路到最后決賽,每一場比賽雙方的進球數(shù)都可以期望一番,最后獲得一個“最平均”的世界杯全程模擬結果。

評:投行一貫的神秘模型來忽悠投資者,Elo模型就是高深黑洞,關鍵環(huán)節(jié)恕不奉告,至于準確與否,只有神知道。

嚴格的講,以上幾家的世界杯預測都不能算“大數(shù)據(jù)分析”,只是傳統(tǒng)的統(tǒng)計分析,雖然數(shù)據(jù)“大”,但并未融合多種因素綜合考慮,可見在專業(yè)領域還是相信經典理論。

霍金想法最娛樂


霍金收集了大量的數(shù)據(jù),包括歷史記錄、溫度、球場的海拔高度等,把所有數(shù)據(jù)都集中起來,分析你事先不知道的事情,或許能發(fā)現(xiàn)一些規(guī)律。它的原理不是傳統(tǒng)的分析,更多的是基于關系的一種預測。霍金19頁的分析結果是關于如何提高英格蘭隊的奪冠幾率,但最后卻拋出一個讓英格蘭球迷傷心的終極結論:個人更看好巴西隊奪冠。霍金認為英格蘭隊首先需要在海拔500米以下的球場比賽,氣溫的提升會降低贏球可能,在巴西當?shù)貢r間15時是最好的比賽時間。從球隊自身來說,433陣型無疑是奪冠的節(jié)奏,而且必須穿上紅色戰(zhàn)袍。提到點球大戰(zhàn),霍金認為助跑必須不少于三步,如果速度上不去,進球幾率只有58%。瞄準上角的點球有84%的命中率,金發(fā)和禿頭的球員射中的概率達到更高的84%,前鋒的進球概率超過80%,中場與后衛(wèi)遞減。


評:霍金老爺爺最近幾年很喜歡預測,還預測過世界將在兩百年之后滅亡,這次娛樂世界杯一下,也算是比黑洞要沾地氣。如果預測對了,建議用這個理由把早就該屬于霍金的諾貝爾獎發(fā)了吧。


科隆體育最繁瑣


德國科隆體育學院根據(jù)復雜的計算機模擬測算得出的本屆世界杯預測結果:科隆體育學院的格羅爾教授領導研究小組以自己設計的計算機模擬算式一共進行了10萬次測算,綜合考慮各隊的世界排名、足彩賠率、市值、預選賽表現(xiàn),還包括可能的傷病、戰(zhàn)術、氣候條件、主場優(yōu)勢因素。他們預測,巴西隊與阿根廷隊將爭冠,衛(wèi)冕冠軍西班牙有可能止步小組賽,從西荷大戰(zhàn)那個驚悚的5比1賽果,看來德國人的模擬測算還有靠譜的。


評:德國人的嚴謹是出了名的,而且竟然沒有預測德國奪冠,對于西班牙卻一語中的,估計他們現(xiàn)在都在祈禱決賽的預測是錯誤的,否則作為物理學家的默克爾總理不會答應。


熊貓預測夭折了


世界杯開幕前,據(jù)媒體報道,中國保護大熊貓研究中心稱將派出一到兩歲的熊貓寶寶來預測世界杯。小組賽階段,主辦方會拿出三個竹筐代表主隊的勝平負,熊貓寶寶則通過選擇哪個筐里的食物來預測比賽結果。等到了淘汰賽,熊貓寶寶們還會通過爬樹和賽跑來預測結果。前者是讓熊貓爬上掛有一方球隊國旗的樹木來預測,后者則是兩個熊貓寶寶分別穿上兩隊球衣,通過誰先跑到目的地來預測比賽結果。就在世界杯開賽之后,“熊貓預測世界杯”活動已經被取消。


評:本來要頂替章魚保羅的國寶沒了用武之地,國人還是缺乏點娛樂精神,借此機會宣傳下大熊貓,有何不可,萬一要是預測對了,那大熊貓基地豈不成了大師圣地,還愁旅游不火?


微軟相信EXCEL


微軟必應大數(shù)據(jù)之前曾多次成功預測奧斯卡獎項、投票大選。微軟的預測考慮過往比賽歷史、主場客場、地理位置、草坪狀況、天氣以及“群眾智慧”等等多種因素,還使用大量的公開數(shù)據(jù)——博彩市場、民意調查、社交媒體以及其它在線數(shù)據(jù),利用大數(shù)據(jù)分析來判斷每場比賽的結果。據(jù)說這一切都是用EXCEL來完成的,我們權當其是軟件推廣策劃吧。


微軟:相信EXCEL是萬能的,但預測足球估計是萬萬不能的,不過,人家說奧斯卡、大選都預測對了,還是看結果吧。


雅虎相信網絡流言


雅虎用輕博客網站Tumblr的數(shù)據(jù)來估計每支國家隊的優(yōu)勢,最終計算出最可能獲勝的是巴西。雅虎研究小組分析的前提是,Tumblr上所有有關世界杯的討論都具有一定價值。為了查明哪些國家將相互較量,小組會根據(jù)之前比賽的結果為每支隊伍賦予優(yōu)勢值。針對每一次比賽,雅虎會利用名為泊松分布不同參數(shù)的概率論來估計每一支隊伍可能的進球數(shù)量。


評:雅虎相信的是目前最火的社交網絡數(shù)據(jù),據(jù)說可以預測傳染病和犯罪現(xiàn)場,不知道對足球是否有效?


(據(jù)說美女主持穿什么球衣,什么球隊就輸球,而美女的球衣選擇是靠網民投票出來的,所以,也證明了冷門太多)


當然,雖然很多人相信大數(shù)據(jù)能夠幫助我們預測世界杯,也有不可預測派。美國的洛斯·阿拉莫斯國家實驗室的三位統(tǒng)計物理學家曾經對大型體育比賽的賽況進行數(shù)據(jù)化分析,發(fā)現(xiàn)在棒球、曲棍球、籃球、橄欖球以及足球五大項目中,足球比賽是其中最具懸念,賽果最具不確定性的,弱旅戰(zhàn)勝強隊的概率居高不下,即使使用科學方法也未能得到準確的預測。

說實話,作為統(tǒng)計專業(yè)人士,對足球預測不敢太相信,體育比賽確實可以預測,足球也不例外,但足球項目影響因素太多,特別是世界杯足球比賽相對場次不多、間隔周期太長,致使數(shù)據(jù)量很小,比賽中又有太多的主觀因素(比如裁判),有時候這種比賽的預測和算命沒什么差別。


本文地址:http://www.quema.com.cn/artinfo/842.html

最新收錄 最新審核通過的網站

?