K090 仮説検定
- 2. 仮説検定 Hypothesis testing
? 母集団の特性値についてある情報を持っている
? その情報が正しいか否かを知りたい
? 帰無仮説と対立仮説
null hypothesis/ alternative hypotheis
帰無仮説 (null hypothesis)
対立仮説 (alternative hypothesis)01
00
:
:
??
??
≠
=
H
H
のどちらが尤もらしいか、データに基づいて確率的に判定
- 3. 検定の誤り
? 第 1 種の誤り
? H0 が正しいのに棄却してしまう
? 第 2 種の誤り
? H1 が正しいのに, H0 と結論してしまう。
? α と β を両方同時に小さくすることはできない
? α + β =1ではないことに注意
H0 が正しい H1 が正しい
H0 を採択 正しい
1- α
第 2 種の誤り (Type II error)
β
H1 を採択
(H0 を棄却 )
第 1 種の誤り (Type I error)
α
正しい
1- β (検出力)
01
00
:
:
??
??
≠
=
H
H
- 4. 有意水準 (significance level)
? 第1種の誤りの確率を「有意水準」以下に抑え、その上で、
第2種の誤りの確率を最小化する。
? 有意水準 α としては、 0.05 、 0.01 という値が例ではよく使
われる
最小化
という条件で
→
≤
}|Pr{
}|Pr{
10
01
HH
HH α
- 5. ? 有意水準 α
?どの程度の確率を小さいと定めるか
?分野ごとに異なるが, α=0.05 (5%) , 0.01 (1%) が良く使わ
れる。
? 棄却,採択
?「帰無仮説を棄却する」とは
? 帰無仮説が真であれば,この値が得られる確率はこの
ように小さいはずがない→確率が小さくなっているのは
,帰無仮説が誤りである→
? 帰無仮説を否定
?「帰無仮説を採択する」,「帰無仮説を棄却できない」
? 帰無仮説を認めるとき(消極的に認める:理由はあと
で)
- 7. 有意とは
? 第 2 種の誤り
?帰無仮説が棄却できなかったとき、その結論が誤っている
確率、すなわち第 2 種の誤りの確率はどの程度であろう
か?
?残念ながら、この誤りの確率は計算できないことが多い
?計算できないので、最悪のことを考えておこう
?すなわち、「第 2 種の誤りの確率は大きい」と考えよう
?帰無仮説を受容しても、その結論が誤っている確率が大き
い!
?誤っている可能性が高い結論を出しても、その結論には
意味が無い!
?帰無仮説を受容するという結論にはあまり意味が無い
? 第 1 種の誤り
?逆に、意味が有るのは、帰無仮説を棄却域するという結論
を出したとき、その結論が誤っている確率、すなわち第 1
種の誤りは高々 α (有意水準、 5% とか、 1% とか)で小
- 9. つづき
? 有意水準 α を定める。(通常 0.05 ,慎重なら 0.01 )
? 棄却域の設定
? Z は標準正規分布に従うので,棄却域は
? 両側検定の場合
? z0.025 = 1.96
から棄却域を設定する
? データ(サンプル)から, Z の実現値を計算する
? 判定
? Z が棄却域に入っていれば,帰無仮説を棄却する
- 17. 有意になる回数の分布
rsim.t <- hist.t.sig(1000, 100, 10, 0.05)
min(rsim.t)
max(rsim.t)
rsim.t <- hist.t.sig(1000, 100, 10, 0.05)
min(rsim.t)
max(rsim.t)
hist(rsim.t)
hist(rsim.t)$count
sum(rsim.t)
mean(rsim.t)
Histogram of rsim.t
rsim.t
Frequency
0 2 4 6 8 10 12
050100150
- 20. x <- sapply(rep(10, 100), rnorm)
sdx <- apply(x, 2, sd)
ssq <-sdx * sdx * 9
chi0 <- ssq / 1
points(chi0, runif(100) * 0.001)
for (i in chi0)
if(i < chiL || i > chiU)
print(i)
[1] 23.95675
[1] 1.926886
[1] 20.87051
[1] 2.309102
[1] 19.69925
0 5 10 15 20 25 30
0.000.020.040.060.080.10
x
chisqdens9(x)
- 24. mu1 <- seq(-2, 2, 0.1)
prslt <- calc.power(1000, 10, 0.05, mu1)
prslt
plot(mu1, prslt, type = "l")
帰無仮説から離れるほど
大きくなる
-2 -1 0 1 2
0.20.40.60.81.0
mu1
prslt
- 25. 理論的には
x <- seq(-2, 2, 0.01)
plot(x, power.theo(x, 0.05, 10), type = "l")
-2 -1 0 1 2
0.20.40.60.81.0
x
power.theo(x,0.05,10)