5.2節正規分布

著者:梅谷武
語句:正規分布,Gauss分布,de Moivre-Laplaceの定理

正規分布について述べ、中心極限定理の原型であるde Moivre-Laplaceの定理をStarlingの公式を使って証明する。

作成:2012-01-27
更新:2012-02-26

5.2 正規分布

5.2.1 分布

(ℝ,

₁)上の次の密度関数fの定める分布を、平均m、分散σ²の正規分布せいきぶんぷ, normal distributionあるいはGauss分布がうすぶんぷ, Gauss distributionといい、N(m,σ²)で表わす。

密度関数

f(x) ≡

√2πσ

exp

－

(x－m)²

2σ²

これが確率測度を定めることを示す。

t =

x－m

√2σ

とおいて置換積分すると

∫

ℝ

e^－t²dt

∫

ℝ

e^{－(x－m)²/2σ²}

√2σ

であるから

∫

ℝ

f(x)dx

√π

∫

ℝ

e^－t²dt

= 1

となる。

5.2.2 平均と分散

te^－t²は奇関数であるから

∫

ℝ

te^－t²dt

= 0

したがって

平均

∫

ℝ

xf(x)dx

√π

∫

ℝ

(√2σt + m)e^－t²dt

= m

∫

ℝ

(x－m)²f(x)dx

√π

∫

ℝ

(2σ²t²)e^－t²dt

2σ²

√π

－

e^－t²

∞

－∞

σ²

√π

∫

ℝ

e^－t²dt

= σ²

したがって

分散

∫

ℝ

(x－m)²f(x)dx

= σ²

5.2.3 積率母関数

正規分布N(m,σ²)に従う確率変数Xの積率母関数を求める。

M_X(t)

√2πσ

∫

ℝ

exp(tx) exp

－

(x－m)²

2σ²

√2πσ

∫

ℝ

exp

－

2σ²

{(x－m)－σ²t}² ＋ mt ＋

σ²t²

exp

mt ＋

σ²t²

√2πσ

∫

ℝ

exp

－

2σ²

{(x－m)－σ²t}²

ここで、

y ≡

x－m

－ σt

とおくと、x = σy + m + σ²tであり、

√2πσ

∫

ℝ

exp

－

2σ²

{(x－m)－σ²t}²

√2π

∫

ℝ

exp

－

y²

= 1

となるから

積率母関数

M_X(t) = exp

mt ＋

σ²t²

5.2.4 再生性

定理5.2.4.1 正規分布の再生性

独立な確率変数X_i, i = 1,⋯,nがそれぞれ正規分布N(m_i,σ_i²)に従っているとき、それらの一次結合Y ≡ a₀ + a₁X₁ + ⋯ + a_nX_nは正規分布

N( a₀ + a₁m₁ + ⋯ + a_nm_n, a₁²σ₁² + ⋯ + a_n²σ_n² )

に従う。

証明

X_iの積率母関数をM_i(t)とおくと

M_Y(t)

exp(a₀t)

n
∏
i = 1

M_i(a_nt)

exp(a₀t)

n
∏
i = 1

exp

a_im_it +

a_i²σ_i²t²

exp

(a₀+a₁m₁+⋯+a_nm_n)t +

(a₁²σ₁²+⋯+a_n²σ_n²)t²

■

5.2.5 de Moivre-Laplaceの定理

中心極限定理により、二乗可積分な独立同分布確率変数列の第n項までの和が正規分布に法則収束することがわかっているが、これはBernoulli試行列の和が正規分布に法則収束するというde Moivre-Laplaceの定理どもあぶるらぷらすのていり, de Moivre-Laplace's theoremが発展したものである。ここではStarlingの公式を使うその古典的な証明を示す。

成功確率pのBernoulli試行列の第n項までの和である二項分布Bin(n,p)

μ_{S_n} =

n
∑
k = 0

(

n
k

)

p^kq^n－kδ_k

の0≦k≦nにおける確率

(

n
k

)

p^kq^n－k

をn → ∞のとき、Starlingの公式

n! ∼ √2πnnⁿe^－n, (n → ∞), n ∈ ℕ

で近似することを考える。

まず単純な代入により次が得られる。

(

n
k

)

p^kq^n－k ∼

2πk(n－k)

^1/2

n－k

^n－k

x ≡ k － npとおくと右辺は

(5.1)

2π(np+x)(nq－x)

^1/2 ×

np+x

^np+x

nq－x

^nq－x

この(1)の右側の項の対数をとり、log(1+s)の級数展開を3次まで行なう。

－log

np+1

^np+x

nq－x

^nq－x

－(np+x)log

1 +

－ (nq－x)log

1 －

－(np+x)

－

x²

2n²p²

＋

x³

3n³p³

+ ⋯

+ (nq－x)

x²

2n²p²

＋

x³

3n³p³

+ ⋯

－

x²

＋

x³

6n²

p²

－

q²

+ ⋯

これは

x³

n²

0, (n → ∞)

のとき

－log

np+1

^np+x

nq－x

^nq－x

∼ －

x²

2npq

が成り立つ。(1)の左側の項はn → ∞で

√2πnpq

に近づく。ここまでの結果を補題としてまとめる。

補題5.2.5.4

0 ＜ p ＜ 1, q ≡ 1 － pとし、0≦k≦n, k,n ∈ ℕは

(k－np)³

n²

0, (n → ∞)

を満たすとする。このとき次が成り立つ。

(

n
k

)

p^kq^n－k ∼

√2πnpq

exp

－

(k－np)²

2npq

この補題を使って標準化した二項分布列は標準正規分布に法則収束するというde Moivre-Laplace定理を証明する。

定理5.2.5.6 de Moivre-Laplace

0 ＜ p ＜ 1, q ≡ 1 － pとし、成功確率pのBernoulli試行列の第n項までの和をS_nとするとき、次が成り立つ。

lim
n → ∞

a ＜

S_n－np

√npq

≦ b

√2π

∫

b

a

e^－x²/2dx

証明

a ＜

S_n－np

√npq

≦ b

P(np+a√npq＜S_n≦np+b√npq)

∑
np+a√npq ＜ k ＜ np+b√npq

(

n
k

)

p^kq^n－k

が成り立つ。

x_k ≡

k－np

√npq

とおくと、a＜x_k≦bより補題の条件が満たされるから、

Δx_k ≡ x_k+1 － x_k =

√npq

とおけば、n → ∞のとき

a ＜

S_n－np

√npq

≦ b

∼

∑
a ＜ x_k ≦ b

√2π

e^x_k²/2Δx_k

この右辺は

√2π

∫

b

a

e^－x²/2dx

に収束する。■

成功確率pのBernoulli試行列X_k, k =1,2,⋯の各項の平均はp、分散はpqであるから、これを標準化してn項までの和を√nで割ると

Y_n

≡

√n

n
∑
k = 1

X_k － p

√pq

S_n－np

√npq

となり、de Moivre-Laplaceの定理は中心極限定理の特別な場合であることがわかる。

5.2.6 グラフ

graph005.r

N(0,σ²), σ = 1, 1.5, 2, 2.5を描く。

x <- seq( -8, 8, 0.1 )
plot( x, dnorm( x, 0, 1.0 ), type="l", xlab="", ylab="" )
points( x, dnorm( x, 0, 1.5 ), type="l", col="red" )
points( x, dnorm( x, 0, 2.0 ), type="l", col="green" )
points( x, dnorm( x, 0, 2.5 ), type="l", col="blue" )
legend( 4, 0.4,
  legend = c( "σ = 1.0", "σ = 1.5", "σ = 2.0", "σ = 2.5" ),
  col = c("black","red","green","blue"),
  lty = 1 )

図5.2.6.4 正規分布

graph006.r

Bin(n,0.1), n = 10, 30, 50, 100と平均、分散が同じ正規分布を比較する。

k <- 0:20
plot( k, dbinom( k, 10, prob=0.1 ), type="l", xlab="", ylab="",
  ylim = c( 0.0, 0.5 ) )
points( k, dbinom( k,  30, prob=0.1 ), type="l", col="red")
points( k, dbinom( k,  50, prob=0.1 ), type="l", col="green")
points( k, dbinom( k, 100, prob=0.1 ), type="l", col="blue")
par(new=T)
x <- seq(0,20,0.1)
points( x, dnorm( x, 1, sqrt(10*0.1*0.9) ), type="l",
  lty="dotted" )
points( x, dnorm( x, 3, sqrt(30*0.1*0.9) ), type="l",
  col="red", lty="dotted" )
points( x, dnorm( x, 5, sqrt(50*0.1*0.9) ), type="l",
  col="green", lty="dotted" )
points( x, dnorm( x, 10, sqrt(100*0.1*0.9) ), type="l",
  col="blue", lty="dotted" )
legend( 15, 0.5,
  legend = c( "n = 10", "n = 30", "n = 50", "n = 100" ),
  col = c("black","red","green","blue"),
  lty = 1 )

図5.2.6.8 二項分布との比較

数　　学

正規分布せいきぶんぷ, normal distribution
Gauss分布がうすぶんぷ, Gauss distribution
de Moivre-Laplaceの定理どもあぶるらぷらすのていり, de Moivre-Laplace's theorem