7.1節 統計的推測の基礎
著者:梅谷 武
語句:母集団,無作為,標本,母集団分布,母数,パラメトリック,ノン・パラメトリック,統計量,標本平均,母平均,母分散,標本分散,推定量,推定値,点推定,不偏性,不偏推定量,一致性,一致推定量,最尤法,最尤推定量,区間推定,下側信頼限界,上側信頼限界,信頼係数,信頼区間,対偶,仮説検定,仮説,検定統計量,棄却,有意水準,有意,帰無仮説,対立仮説,棄却域
統計的推測の用語や基本概念の整理しながら、確率論との関係について述べる。
作成:2012-02-25
更新:2012-02-28
統計的推測では確率論の手法がそのまま用いられるが、あらかじめ確率分布が与えられる確率論の問題とは逆に、確率分布を推測することが問題となる。また言葉遣いも確率論とはやや異なり、混乱をもたらしかねない独特のものがあるため、まず最初に統計学の諸概念が確率論ではどのような意味をもつのかということを確認しておく必要がある。
例として日本人全体を母集団Ωとし、無作為抽出された各個人ωの身長X(ω)を測り、その傾向を調べることを考える。
日本の人口を
N人とし、その中から一人を標本として抽出する確率を
とする。
Pは可測空間
(Ω,2Ω)上の確率測度となる。
標本ひょうほん, sampleという言葉は、各個人
ω、
ωに対してその身長
X(ω)を対応させる関数、すなわち確率変数
X、測定した値
X(ω)の三通りの意味に使われる。文脈により意味が異なるので注意が必要である。標本、標本変数、標本値というように言葉を使い分けることも考えられるが、やや不自然な文章になってしまう。ここでは慣例に従い、文脈により意味を変えることにする。
特に断らない限り、母集団から無作為にn個抽出した標本X1, ⋯, Xnは独立同分布確率変数であると考える。母集団が有限個である場合でも、その個数がnに比べて十分に大きいと仮定し、復元抽出であるか非復元抽出であるかは問題にしない。
証明
演習とする。■
正規母集団
N(m,σ2)の
n個の標本平均
Xは正規分布
N(m,σ2/n)に従う。
証明
演習とする。■
正規母集団
N(m,σ2)の
n個の標本平均
Xを標準化した統計量
は標準正規分布
N(0,1)に従う。
証明
演習とする。■
証明
Xi-m = (Xi-X) + (X-m)より
したがって
ここで
であるから
E[ | | ] = nσ2 - σ2 = (n-1)σ2
|
であり
■
正規母集団
N(m,σ2)の
n個の標本平方和
S2について、
S2/σ2は自由度
n-1の
χ2分布
χ2(n-1)に従う。
証明
演習とする。■
正規母集団
N(m,σ2)の
n個のt統計量
は自由度
n-1の
t分布
t(n-1)に従う。
証明
演習とする。■
命題7.1.3.4と命題7.1.3.7から次がわかる。
標本平均は母平均の不偏推定量であり、標本分散は母分散の不偏推定量である。
標本平均は母平均の一致推定量であり、標本分散は母分散の一致推定量である。
証明
演習とする。■
L = L(X1, ⋯, Xn), U = U(X1, ⋯, Xn)はともに標本
X1, ⋯, Xnの関数であり、区間推定は母集団分布の確率測度
Pにより、
P( L(X1, ⋯, Xn) ≦ θ ≦ U(X1, ⋯, Xn) ) = 1-α
|
という形式で表現される。
Lを
下側信頼限界したがわしんらいげんかい, lower confidence limit、
Uを
上側信頼限界うえがわしんらいげんかい, upper confidence limit、確率
1-αを
信頼係数しんらいけいすう, confidence coefficient、区間
[L,U]を
100(1-α)%信頼区間しんらいけいすう, confidence intervalという。
区間推定は、母集団から無作為抽出した標本について信頼区間を計算する行為を試行、区間[L,U]に母数θが含まれることを成功とする、成功確率1-αのBernoulli試行と考えることができる。
正規母集団
N(m,σ2)の
n個の標本平均
Xについて
は標準正規分布
N(0,1)に従うから、
により
u(α/2)を定めると
P( -u(α/2) ≦ √n(X-m)/σ ≦ u(α/2) ) = 1-α
|
P( X-u(α/2)σ/√n ≦ m ≦ X+u(α/2)σ/√n ) = 1-α
|
より
信頼区間
[X-u(α/2)σ/√n, X+u(α/2)σ/√n]
|
正規母集団
N(m,σ2)の
n個のt統計量
は自由度
n-1の
t分布
t(n-1)に従うから、上と同様に
t(α/2)を定めれば、
P( -t(α/2) ≦ √n(X-m)/s ≦ t(α/2) ) = 1-α
|
P( X-t(α/2)s/√n ≦ m ≦ X+t(α/2)s/√n ) = 1-α
|
より
信頼区間
[X-t(α/2)s/√n, X+t(α/2)s/√n]
|
正規母集団
N(m,σ2)の
n個の
(n-1)s2/σ2は自由度
n-1の
χ2分布
χ2(n-1)に従うから、
P( K(1-α/2) ≦ (n-1)s2/σ2 ≦ K(α/2) ) = 1-α
|
P( (n-1)s2/K(α/2) ≦ σ2 ≦ (n-1)s2/K(1-α/2) ) = 1-α
|
より
信頼区間
[(n-1)s2/K(α/2), (n-1)s2/K(1-α/2)]
|
数学的な命題は、あいまいさを排除するために、形式論理と呼ばれる共通の記号や構文、証明の元になる規則が定められた論理体系で記述される。例えば「命題
Pが成り立てば命題
Qが成り立つ」という命題は次のように表現される。
命題
Pの否定「
Pは成り立たない」という命題は次のように表現される。
古典論理と呼ばれる体系では、「任意の命題Pについて、Pまたは¬ Pのどちらかが成り立つ」という排中律を仮定している。これは次のように表現される。
この体系においては次の命題が証明できる。
( P ⇒ Q ) ⇒ ( ¬ Q ⇒ ¬ P )
|
いわゆる
対偶たいぐう, contrapositionである。これを利用するのが仮説検定である。
以下、具体例で説明する。
正規母集団
N(m,σ2)において、母平均
mに関する帰無仮説を
対立仮説を
とする。これについて
n個の標本平均
Xと標本分散
s2を使って有意水準
αで検定する。
まず、理論的帰結としてt統計量
が自由度
n-1の
t分布
t(n-1)に従うという性質を使う。
正規母集団
N(m,σ2)において、母平均
mに関する帰無仮説を
対立仮説を
とする。何らかの理由により
m ≦ Cが成り立つことを前提としている。
これについて有意水準
αで検定する。
理論的帰結としてt統計量
が自由度
n-1の
t分布
t(n-1)に従うという性質を使う。
これに対して実験結果として
X = A, √s2 = Bを得たとする。
を計算し、これが
t分布の左側の領域で確率が
αとなる棄却域に含まれるとき、すなわち
のとき棄却する。
数 学
母集団 ぼしゅうだん, population
無作為 むさくい, random
標本 ひょうほん, sample
母集団分布 ぼしゅうだんぶんぷ, population distribution
母数 ぼすう, parameter
パラメトリック ぱらめとりっく, parametric
ノン・パラメトリック のんぱらめとりっく, non-parametric
統計量 とうけいりょう, statistic
標本平均 ひょうほんへいきん, sample mean
母平均 ぼへいきん, population mean
母分散 ぼぶんさん, population variance
標本分散 ひょうほんぶんさん, sample variance
推定量 すいていりょう, estimator
推定値 すいていち, estimate
点推定 てんすいてい, point estimation
不偏性 ふへんせい, unbiasedness
不偏推定量 ふへんすいていりょう, unbiased estimator
一致性 いっちせい, consistency
一致推定量 いっちすいていりょう, consistent estimator
最尤法 さいゆうほう, maximum likelihood method
最尤推定量 さいゆうすいていりょう, maximum likelihood estimator
区間推定 くかんすいてい, confidence interval
下側信頼限界 したがわしんらいげんかい, lower confidence limit
上側信頼限界 うえがわしんらいげんかい, upper confidence limit
信頼係数 しんらいけいすう, confidence coefficient
信頼区間 しんらいけいすう, confidence interval
対偶 たいぐう, contraposition
仮説検定 かせつけんてい, hypothesis testing
仮説 かせつ, hypothesis
検定統計量 けんていとうけいりょう, test statistic
棄却 ききゃく, reject
有意水準 ゆういすいじゅん, significance level
有意 ゆうい, significant
帰無仮説 きむかせつ, null hypothesis
対立仮説 たいりつかせつ, alternative hypothesis
棄却域 ききゃくいき, rejection region