體育賽事具有隨機性,即使是最優秀的球員或球隊也可能經歷運氣不佳和低谷時期。這種隨機性使得投注變成了估算事件概率的遊戲。很多人認為,只要能夠提高預測準確度,長期來看就能賺大錢。這種想法是錯誤的,接下來我們會用具體例子來說明為什麼。
要理解以下內容,你需要具備基本的賠率知識,了解何謂公平賠率、賠率為何會變動,以及如何將它們轉化為概率和預測。如果你不清楚這些概念,請參考我們相關的文章。如果你想了解更多關於模型預測的內容,也可以查看我們的網站。
預測是找出概率
建立預測模型、從賠率計算隱含概率或從投票百分比中得出結果的機率,這些方法的目標都是一樣的:估算隨機事件每個可能結果的機率。這就是預測的本質,評估概率並推導出投注的結果。剛提到三種估算概率的方法,那麼該如何比較它們呢?哪種方法最好?
使用統計學或機器學習從數據中學習。主要優勢是只要有足夠的數據,就可以預測任何事情。主要缺點是需要具備強大的計算機科學知識,處理異構數據,並會編程。
基本上是將賠率轉化為概率。主要優勢是在市場流動性高的情況下,準確性很高,因為當有足夠的資金投入時,會得到非常好的概率估計。然而,也有缺點。準確性取決於莊家及其去除利潤的方式,而且無法用這些概率打敗莊家。
從網站、論壇或社交媒體收集,這是獲取概率的最簡單方法。如果有足夠的投票,準確性也很高,但缺點是缺乏市場數據,並且從多個來源收集數據很困難。
為了比較不同的技術,我們需要一個測量估算概率質量的方法。一個好的候選方法是對數損失(log-loss)。對數損失衡量了事件概率估算的質量。如果將多個事件的對數損失平均化,可以得到技術質量的估計。數學上,平均對數損失為:
假設一場足球比賽的勝負概率如下:主隊勝(60%)、平局(30%)、客隊勝(10%)。如果主隊勝,對數損失為 -0.51;但如果客隊勝,對數損失為 -2.30。可以看到,如果預測錯誤,對數損失會較大。而這個指標總是負值。平均對數損失越接近零,預測質量越好。這個指標(或其衍生物)也用於訓練機器學習模型。要比較模型只需從平均對數損失中選擇最好,而為了得到準確的答案我們需要大量樣本數據。
擊敗莊家是尋找價值
眾所周知,價值投注是長期擊敗莊家的唯一途徑。價值投注簡單來說就是莊家高估了賠率。換句話說,這也是隱含概率遠低於事件發生的真實概率。真實概率是未知的,必須使用前面提到的方法來估算。問題在於這些技術並非設計用來尋找價值。機器學習模型訓練的目的是獲得最準確的概率,隱含賠率對價值投注無用,投票只是調查的結果。為了尋找價值,我們可以訓練一個檢測算法或讓用戶對他們認為有價值的賠率進行投票。這樣做,你可能會選擇高賠率並有低命中率。實例說明,一個很好的例子是初創公司Mercurius,他們使用算法在足球比賽中尋找價值投注。根據他們的網站(截至2021年6月),他們投注的平均賠率為3.97,命中率為34.35%,而他們的收益率為2.46%。這些數據表明:
- 擊敗莊家是困難但可能的
- 低準確性並不意味著會虧損
- 需要精確有效的歷史賠率
- 價值投注檢測與事件的不確定性相關
有趣的是,平均隱含概率為33.07%(假設零利潤),因此這確實是一種集中於罕見事件的價值投注策略。命中率為34.35%,收益率大致為34.35%*(1/33.07%)-1 = 2.58%。基本上,你需要一個命中率(sr)大於平均隱含概率(aip)來獲得正收益。要擊敗莊家,你需要專注於在不確定性高的事件中檢測價值。這些準確性低的事件具有高不確定性,可能與事件本身或投注數量相關,導致賠率高於應有水平,從而創造可利用的定價錯誤。
如何使用概率?
我們可以使用概率,但需要建立價值檢測器。例如,可以使用這些概率作為輸入給另一個專門訓練來產生長期利潤的模型。使用歷史賠率可以模擬過去的策略。例如,我們可以測試開盤賠率是否更有價值,或者概率是否比莊家在高賠率情況下更好。最重要的是建立概率與長期擊敗莊家的事件之間的聯繫。
結論
本文展示了預測和擊敗莊家是使用概率的兩種不同方法。預測的目標是生成準確的概率,而擊敗莊家的目標是生成長期利潤。雖然它們相互關聯,但概率需要通過與賠率數據的額外處理來檢測莊家的價格何時稍有錯誤。