賭徒破產理論(Gambler's ruin)指指的是兩位賭徒,每局賭1元,A賭徒有i元,B賭徒有n-i元,兩人不斷的賭,直到一人輸光為止。
前言
假設A賭徒勝率為p,輸的機率就是1-p,稱為q,我們要求算A贏光所有錢的機率。
讓p(i)代表A賭徒擁有i元的時候,獲得最後勝利的機率。
p(0) = 0,因為已經輸光所有錢並且賭局已結束。
p(n) = 1,因為已經贏光所有錢並且賭局已結束。
那麼p(i)呢?
遞迴公式(recursive formula)
假設A有i元,它下一局有可能贏,有可能輸。贏的機率為p,輸的機率為1-p = q。
不論這一局是贏還是輸,A要贏光所有錢的機率還是沒有算出來。
這局贏了,接下來贏光所有錢的機率為p(i+1)。
這局輸了,接下來贏光所有錢的機率為p(i-1)。
因此,p(i) = p*p(i+1) + q*p(i-1),且可以繼續延伸,例如p(i+1) = p*p(i+2) + q*p(i)、p(i-1) = p*p(i-) + q*p(i-2)...
每個公式需要套用原本的公式,稱為遞迴公式公式,而遞迴公式解法可以像解微分方程(differential equation)一樣,可以先用猜的!
例如dx/dt = rx,微分之後x還是在公式裡,可以先猜測x = e^y。
猜測
假設,p(i) = xi,並帶入p(i) = p*p(i+1) + q*p(i-1),得到
xi = p*xi+1 + q*xi-1
x = p*x2 + q
p*x2 - x + q = 0
解一元二次方程式得
x = 1 或 x = q/p
微分方程
p(i) = xi,x = 1 或 x = q/p,且有兩已知數p(0) = 0 及 p(n) = 1。
而xi的x有兩個根(root),必須都帶入線性組合(linear combination)公式求解。
p(i) = A(1)i + B(q/p)i = A + B(q/p)i
p(0) = A+ B = 0 , A = -B
p(n) = A+ B(q/p)n = 1
A+ B(q/p)n = -B + B(q/p)n = B(-1 + (q/p)n) = 1
B = 1 / ( (q/p)n -1)
A = 1 / (1 - (q/p)n)
故,
p(i) = A(1)i + B(q/p)i = 1 / (1 - (q/p)n) + (q/p)i / ( (q/p)n -1)
= ((q/p)i - 1) / ( (q/p)n -1)
這個答案僅適用當p不等於q的時候,因為我們假設x有兩個根,如果p = q,則q/p = 1,這樣的話就只有一個根了。
當p = q
如果p = q,我們可以用極限來解,也就是讓p非常接近q,得到
((q/p)i - 1) / ( (q/p)n -1) = 0 / 0
使用羅必達法則 (L'Hôpital's rule),除數及被除術都以q/p微分,得到
i*(q/p)i-1 / n*(q/p)n-1 = i / n
應用
工具
賭徒破產理論機率計算可參考:賭徒破產理論機率計算
留言
張貼留言