這次是對 3、4月份的統一發票,
因為樣本數量很多,所以想說拿來做個統計XD
取樣的母體總數共 304 張~
開獎末三碼:(包含特別獎) 692 / 733 / 614 / 326 / 228 / 448 / 798
以下按照兩種方式作統計分析:
1. 最末碼是否為 2,3,4,6,8
2. 是否僅末兩碼符合中獎號碼
1. 最末碼是否為 2,3,4,6,8
結果不是符合,就是不符合,所以是一個二項分布,
理論上,最末碼是 2,3,4,6,8 的機率(p)應該跟 0,1,5,7,9 的機率(1 - p)相等,
都是 0.5 才對的,p = 1- p = 0.5
所以 X 屬於二項分佈,母體數為 304, X ~ B(304, 0.5)
期望值 E(X) = np = 152
標準差 S(X) = sqrt(p(1-p)/n) = 0.02868
實際統計結果:
最末碼 2,3,4,6,8 : 141張
最末碼 0,1,5,7,9 : 163張
則統計出的 p = 0.4638,跟理論的機率 0.5 相差 0.0362
也就是機率偏離了 1.26 個標準差 (0.0362/0.02868)
或許,是樣本數不夠的緣故吧?
還是說這是其實是政府的操作?!為了讓中獎者數目變少,節省開支?
但末碼應該是每結一次帳,就會自動加一位,好像難以控制,
會不會是開獎號碼早已被私底下開出,業者刻意保留部分符合的末碼?政商勾結?
還是只是單純的巧合?這些都需要反覆做不同的統計才有辦法證實。
2. 是否僅末兩碼符合中獎號碼
同樣是二項分布,但各組數字的機率 P(X) 需要一些計算,
「僅」末兩碼符合,意思是只能末兩碼符合,也就是差一點點中獎的意思啦~XD
692 / 733 / 614 / 326 / 228 / 448 / 798
x92 方法數: C109 x 1 x 1 = 10 (第一碼不能一樣)
x33, x14, x26, x28, x48, x98 方法數都同上,= 10
因此總共符合方法數 = 70
而任取三碼方法數 = 103
因此機率 p = 0.07
符合與否也是二項分布,X ~ B(304, 0.07)
期望值 E(X) = 21.28
標準差 S(X) = 0.01463
實際統計結果:
有 18 張僅和中獎數字末兩碼相同
統計出的 p = 0.05921,跟理論值 0.7 差了 0.01079
也就是偏離了 0.74 個標準差 (0.01079/0.01463)