NBA大數據預測高達65%準確且能賺錢的分析研究,究竟是真是假呢?



本文作者:koer3741

瀏覽次數:162

建立時間:5/3/2022 4:03:11 PM

回文次數:2

今天來分享一篇研究,是由Matthew Houde所撰寫的《Predicting the Outcome of NBA Games》,是一篇利用機器學習的模型去預測NBA比賽結果的研究,而我們將這篇研究方法實測於2022年,也就是本賽季的常規賽中,回測結果竟然真的可以「賺錢」,所以就讓我們來好好介紹這篇吧!!

 

博彩公司的陰謀

首先,我們以擲硬幣來說明一下博彩公司背後的陰謀,假設你和朋友每人投注 10 元,如果擲出人頭,你可賺到 10 元。如果擲出數字,你就輸掉 10 元,這樣規定下,你們雙方都不占任何便宜,用博彩術語來說,這叫 100% 市場,也就是說投注的一方和受注的一方都沒有任何優勢(利潤),因此,100% 市場就是零利潤的市場。

但如果您是跟尋求利益的博彩公司賭銅板,那結果就不一樣了,此時市場的百分比會超過 100%,而這超出 100% 的市場百分比即是博彩公司加諸在投注者身上的利潤,或是博彩公司為服務收取的費用。

那要如何計算博彩公司每場比賽的利潤呢?其公式如下

 

假設A隊賠率為1.76B隊為2.1,那麼博彩公司的利潤為(1/1.76)*100% +(1/2.1)*100%-100% = 4.4%

而業界目前在各賽事中平均的利潤都高達5%~8%,因此,我們如果將「賠率」加入到我們模型的預測上,雖然預測準確度能夠有效的提升,但也容易使我們的預測越靠近博彩公司,那麼我們與博彩公司之間的利潤差距就會有5%~8%的空間,也因此使我們相對較不易於獲利的原因之一。

Matthew Houde的研究

Matthew Houde的研究則是利用了30個特徵值進行機器學習模型預測,而其30個特徵都未使用到任何賠率,並做出高達65.1%準確度的模型,也因此使我們對其感到興趣。

Matthew Houde所利用的特徵值分別為以下主隊與客隊各15個特徵,而計算週期為本賽季前10場比賽的平均值

 

          並利用六個機器學習的模型進行預測,最終以Gaussian Naïve Bayes模型做出高達65.1%的準確度

實測結果

當我們知道該研究所使用的模型、特徵值等方法後,秉持著數據分析的原則,就必須要實測看看結果究竟如何。因此我們利用了NBA於2022年,也就是本賽季的常規賽做為績效回測的實證,最終回測上的確獲得了「65%」的準確度

在績效的回測上,我們以每次下注1000元,並且只投注於不讓分盤的結果,最終整年的獲利來到了「21920」,而曾經最高獲利來到「26220元」,最低則有到「-19660元」,爆冷門(獲利扣除成本>2000)的比賽就有11筆,而霍獲利介於10002000之間的比賽則有78筆,因此算是抓到相當多冷門的比賽

總結

從本次研究我們得知以下三個論點:

1.博弈公司開出的賠率雖然是預測比賽勝負中重要的特徵值,能有效提升預測準確度,但對於投注者來說獲利不易

2.特徵值未加入賠率下,相對容易預測中冷門的比賽,也因此較容易有較多單筆大的獲利能用於彌補多筆虧損

3.本研究所參考的週期為本賽季前10場比賽,使得賽季初因參考數據較少,較容易失準,因此可以多嘗試不同週期的數據來優化模型的預測

 

 



Koer3741 大大再度出手撰寫統計模型分析文, 大推~~

季後賽靠 Koer3741 明牌發大財囉~~

Guess365
5/9/2022 6:15:34 PM

大推~~快加入追踪~~

miloHuang
5/16/2022 10:34:35 AM