close

這次是對 3、4月份的統一發票,

因為樣本數量很多,所以想說拿來做個統計XD

取樣的母體總數共 304 張~

開獎末三碼:(包含特別獎)  692 / 733 / 614 / 326 / 228 / 448 / 798

 

以下按照兩種方式作統計分析:

1. 最末碼是否為 2,3,4,6,8

2. 是否僅末兩碼符合中獎號碼

 


 

1. 最末碼是否為 2,3,4,6,8

 

結果不是符合,就是不符合,所以是一個二項分布

理論上,最末碼是 2,3,4,6,8 的機率(p)應該跟 0,1,5,7,9 的機率(1 - p)相等,

都是 0.5 才對的,p = 1- p = 0.5

所以 X 屬於二項分佈,母體數為 304, X ~ B(304, 0.5)

期望值 E(X) = np = 152

標準差 S(X) = sqrt(p(1-p)/n) = 0.02868

 

實際統計結果:

最末碼 2,3,4,6,8 : 141張

最末碼 0,1,5,7,9 : 163張

則統計出的 p = 0.4638,跟理論的機率 0.5 相差 0.0362

也就是機率偏離了 1.26 個標準差 (0.0362/0.02868)

 

或許,是樣本數不夠的緣故吧?

還是說這是其實是政府的操作?!為了讓中獎者數目變少,節省開支?

但末碼應該是每結一次帳,就會自動加一位,好像難以控制,

會不會是開獎號碼早已被私底下開出,業者刻意保留部分符合的末碼?政商勾結?

還是只是單純的巧合?這些都需要反覆做不同的統計才有辦法證實。

 


 

2. 是否僅末兩碼符合中獎號碼 

 

同樣是二項分布,但各組數字的機率 P(X) 需要一些計算,

「僅」末兩碼符合,意思是只能末兩碼符合,也就是差一點點中獎的意思啦~XD

 

692 / 733 / 614 / 326 / 228 / 448 / 798

x92 方法數: C109 x 1 x 1 = 10 (第一碼不能一樣)

x33, x14, x26, x28, x48, x98 方法數都同上,= 10

因此總共符合方法數 = 70

而任取三碼方法數 = 103

因此機率 p = 0.07

符合與否也是二項分布,X ~ B(304, 0.07)

期望值 E(X) = 21.28

標準差 S(X) = 0.01463

 

實際統計結果:

有 18 張僅和中獎數字末兩碼相同

統計出的 p = 0.05921,跟理論值 0.7 差了 0.01079

也就是偏離了 0.74 個標準差 (0.01079/0.01463)

 

arrow
arrow

    Davidhu127 發表在 痞客邦 留言(0) 人氣()