利用大數據分析預測MLB勝負(下)



本文作者:koer3741

瀏覽次數:391

建立時間:4/11/2022 1:58:43 PM

回文次數:2

在上一篇文章中,我們介紹了作者最終挑選模了Elastic net (L1+L2) penalty regularization(彈性網路正規化)作為最後的預測模型,那麼我們現在有了特徵值跟預測模型這麼明確的目標,那麼我們一定要來實測看看究竟運用在運彩上是不是能夠得到優異的結果呢?

數據前處理

1.資料抓取與整理

首先我們必須要先處理好所需的數據,我們先去爬取與計算需要的特徵值,我們的數據期間是以2015年賽季到2021年賽季共7年的比賽,並按照作者篩選掉先發投手平均首發低於12場的比賽

2.特徵重要性

我們也進行了特徵重要性的觀察,發現的確就算我們抓取到最新2021年的數據,「上壘率」仍然是影響比賽勝負中最重要的因子

3.模型準確度

我們以2015年到20206年的期間作為模型訓練,而2021年整賽季的數據則做為我們模型最終要實戰的數據,但我們實測的結果在2021年模型的準確度其實只有57.24%,是低於期刊中所顯示的61.77%,這也有可能跟我們訓練的期間長短或是最終驗證的期間差異有關,因為作者是以2016年到20194年的數據做出61.77%,可能剛好在2021年的表現只能獲得57.24%,但不論57.24%或是61.77%,我們都必須要能實際運用在運彩投注上才行

4.運彩績效

可惜的是,該模型在最終2021年模型的績效上不盡理想, 最大累計獲利雖然曾經來到11110元,但最大累計虧損則來到了-98930元,在最終賽季結束時則虧損了90880

其中該模型在2021年最新賽季中,僅預測中了3場獲利高於2000的冷門比賽,獲利介於1000到2000的比賽也僅僅只有173場,其餘都是因為入不付出,而造成了虧損

小結

雖然該模型在2021年賽季中曾經一度獲利來到11110元,但由於我們回測的是「不讓分盤」,如果模型無法有效預測到冷門比賽,就算勝率再高,那麼將容易形成入不付出的情況,但別氣餒,我們將這論文當作是一個模型訓練的基底,我們將會做出更優於該論文的模型,並且有效的運用在運彩中,到時候再來跟大家分享,大家就敬請期待吧!!

沒看過中上篇的人可以去看看唷!!

利用大數據分析預測MLB勝負(上)

利用大數據分析預測MLB勝負(中)



會不會是因為這兩年有疫情的影響,使得歷史數據已不能準確判斷未來的比賽!?

Guess365
4/11/2022 6:52:50 PM

上壘了,但打線爛,串連不了,也是慘...

u2150260
4/12/2022 3:06:27 PM