7.2節 適合度検定
著者:梅谷 武
語句:観測度数,期待度数,適合度検定
適合度検定について述べる。Poisson分布への適合度検定の例を示す。
作成:2012-02-25
更新:2012-03-10

定理7.2.1.1

 母集団Ek個のグループEi, i = 1,⋯,kに分割されており、
E =
k

i = 1
Ei
無作為抽出した標本がEiに属する確率がpiであるとする。
k

i = 1
pi
= 1
このとき、無作為抽出したn個の標本の中でEiに属するものの個数をXiとすると
k

i = 1
(Xi-npi)2
npi
は、nが十分大きいとき自由度n-1χ2分布χ2(n-1)に従う。

証明

演習とする。■
 観測された度数分布が、理論上期待される確率分布から計算される度数分布に適合するかどうかを検定するのが適合度検定てきごうどけんてい, test of goodness of fitである。
 実際の適合度検定においては近似精度を上げるため、期待度数が5以上であることが望ましい。期待度数が5未満の場合は、分類数を減らすような工夫が必要である。
Rutherfordラザフォード, Ernest Rutherford, 1871-1937Geigerガイガー, Johannes Wilhelm Geiger, 1882-1945が1910年に行なった15秒間に放射性物質からスクリ-ンに到達したα粒子数の観測回数のデータを使って、Poisson分布への適合度検定を行なうプログラム例を示す。
 結果としてχ2値の右側確率が0.229となり、有意水準0.05では棄却されない。
o <- c(0,9,37,78,174,263,306,401,373,330,257,
156,93,63,29,24,5,5,2,1,1,1)
k <- length( o )
n <- sum( o )
x <- 0:(k-1)
l <- sum( o * x ) / n
p <- exp(-l) * l^x / factorial(x)
p[k] <- 1 - sum( p[-k] )
e <- n * p
plot( x, o, type="h", xlab="", ylab="" )
points( x, e, type="l", col="red" )
while ( e[1] < 5 ) {
o[2] <- o[2] + o[1]
e[2] <- e[2] + e[1]
o <- o[-1]
e <- e[-1]
k <- k - 1
}
while ( e[k] < 5 ) {
o[k-1] <- o[k-1] + o[k]
e[k-1] <- e[k-1] + e[k]
o <- o[-k]
e <- e[-k]
k <- k - 1
}
z = sum( (o - e)^2 / e )
q <- pchisq( z, (k-2), lower.tail=FALSE )
sprintf("n = %d, k = %d, l = %f, chisq = %f, p = %f",
n, k, l, z, q )
[1] "n = 2608, k = 17, l = 7.735046, chisq = 18.661522, p = 0.229484"
 上の適合度検定はnが十分大きいときにのみ有効であるが、Poisson分布の場合、n = 20程度でも簡易的に適合度検定を行なうことができる。これは平均が分散に等しいということと、標本分散s2について
(n-1)s2
σ2
が自由度n-1χ2分布χ2(n-1)に従うことによる。
 放射線検出器で測定した同一時間内の25組のデータについて、Poisson分布への適合度検定を行なうプログラム例を示す。
 結果としてχ2値の右側確率が0.6258となり、有意水準0.05では棄却されない。
o <- c( 3626,3711,3677,3678,3465,
3731,3617,3630,3624,3574,
3572,3572,3615,3652,3601,
3689,3578,3605,3595,3540,
3625,3569,3591,3636,3629 )
n <- length( o )
m <- mean( o )
v <- var( o )
z <- (n-1)*v/m
q <- pchisq( z, (n-1), lower.tail=FALSE )
sprintf("n = %d, m = %5.1f, chisq = %5.3f, p = %5.4f",
n, m, z, q )
[1] "n = 25, m = 3616.1, chisq = 21.219, p = 0.6258"
人  物
Rutherford ラザフォード, Ernest Rutherford, 1871-1937
Geiger ガイガー, Johannes Wilhelm Geiger, 1882-1945
 
数  学
観測度数 かんそくどすう, observed frequency
期待度数 きたいどすう, expected frequency
適合度検定 てきごうどけんてい, test of goodness of fit