【Python學習筆記_賽事預測-MLB全壘打與勝負的相關?】(下)



本文作者:bestwin

瀏覽次數:40

建立時間:9/14/2022 9:48:21 AM

回文次數:1

《Rick.C & Peter.R 共同創作》

接續【Python學習筆記_賽事預測-MLB全壘打與勝負的相關?】(上)未介紹完的內容,如果還沒看過上篇的記得先去看唷!!

全壘打多者、比較容易得勝?

依照我們一般的邏輯,全壘打多的隊伍獲勝機率應該要較大,但這終究只是我們的猜想,我們就來將數據統計出來看看究竟是不是如我們猜想的一樣。
這裡我們用到剛剛創建的欄位「more_HR_win」來視覺化看看

trace0 = go.Pie(labels=df["more_HR_win"].value_counts().index, 
	            values=df["more_HR_win"].value_counts().values,
	            hole=0.5,
                opacity=0.9,
	            marker=dict(line=dict(color='white', width=1.3))
              ) 
layout = go.Layout(title='全壘打與勝負關係')
data = [trace0]
fig = go.Figure(data, layout)
py.offline.plot(fig, filename=r'C:\Users\Guess365User\Desktop\IT邦寫文\圖表區\全壘打與勝負關係圖.xlsx')

此處藍色(1)為全壘打數多且獲勝者,佔比為68.4%,而橘色(0)為全壘打數多但卻輸者,佔比31.6%,由此可知,全壘打數多者的確擁有較高的獲勝機率,但仍然有高達3成的機率會輸掉比賽
全壘打與勝負關係

三、回測這麼說:客隊全壘打多且獲勝的機率為57.6%

最後,我們來看看這68.4%的全壘打多且獲勝的隊伍中,究竟是主隊較多,還是客隊較多呢?
我們將df中全壘打數多且獲勝的隊伍取出,並存放到「df_hr_win」中

df_hr_win = df[df['more_Batting_HR'] == df['W/L']] 
df_hr_win.head() 

程式碼

接著將「W/L」這欄位的數值視覺化看看

trace0 = go.Pie(labels=df_hr_win["W/L"].value_counts().index, 
	            values=df_hr_win["W/L"].value_counts().values,
	            hole=0.5,
                opacity=0.9,
	            marker=dict(line=dict(color='white', width=1.3))
              ) 
layout = go.Layout(title='全壘打勝負與主客關係')
data = [trace0]
fig = go.Figure(data, layout)
py.offline.plot(fig, filename=r'C:\Users\Guess365User\Desktop\IT邦寫文\圖表區\全壘打勝負與主客關係.xlsx')

藍色(0)表示全壘打數多且獲勝的隊伍為客隊,其佔比達57.6%,而橘色(1)表示全壘打數多且獲勝的隊伍為主隊,佔比為42.4%,由此可知,客隊打出較多全壘打數的獲勝機率較高
全壘打勝負與主客關係

全壘打的逆轉勝是屬於__的?

根據今天的研究,全壘打多者的確獲勝的機率較大,但主隊卻沒因為主隊加持的關係而擊出較多的全壘打,反倒是客隊較容易擊出全壘打,這部分就顛覆我們對主隊優勢的觀點,因此別太相信主隊優勢這一說詞,其對主隊的成績不一定有好的幫助。
  小編這邊反倒認為,全壘打是屬於觀眾的,因為不管是誰敲出去,轟聲都是一樣的熱烈

【參考平台與資訊 & Python語言書籍】

  • [Guess官網平台-分析專欄] https://reurl.cc/yMOVE6
  • [偏不讓你爬:最強Python爬蟲 vs 反爬蟲大戰實錄]
  • [Python 資料科學實戰教本:爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定!]


的確跟我們一般的想像不太一樣,以為主場優勢下的表現應該會比較好

winwin666
9/15/2022 9:29:30 AM