2 つの記事を通して、統計的仮説検定について解説してきました。
より理解を深めるには、自らの手で計算してみることが肝要です。いくつか計算問題を作ったので、理解度チェックにご活用ください。
問題
問題全体を通じて以下の設定をつかいます。
- 仮説:コインの表の出る確率は 1/2
- サンプルサイズ:120
確率値の計算には、下のほうにある確率表を使ってください。
p 値
表の出た回数ごとに、p 値を計算してください。
表の出た回数 | p 値 |
---|---|
60 | |
55 | |
50 |
検出率
真の表の出る確率ごとに検出率を計算してください。
真の表の出る確率 | 検出率 |
---|---|
0.49 | |
0.4 |
β エラーを引き起こす確率
真の表の出る確率ごとに、β エラーを引き起こす確率を計算してください。
真の表の出る確率 | β エラーを引き起こす確率 |
---|---|
0.49 | |
0.4 |
確率表
コインの投げる回数は問題全体で 120 回にそろえてあります。
表の出る確率ごとに、表の出る回数がある値以下 (or 以上) となる確率を表にしています。 つまり左上のセルは、「真の表の出る確率が 0.5 である場合に、表の出る回数が 48 回以下となる確率は 0.018 である」という意味です。
表の出る確率 \ 表の回数 | 48 回以下 | 49 回以下 | 50 回以下 | 55 回以下 | 60 回以下 | 65 回以上 | 70 回以上 | 71 回以上 | 72 回以上 |
---|---|---|---|---|---|---|---|---|---|
0.5 | 0.018 | 0.027 | 0.041 | 0.21 | 0.54 | 0.21 | 0.041 | 0.027 | 0.018 |
0.49 | 0.030 | 0.044 | 0.065 | 0.27 | 0.62 | 0.15 | 0.025 | 0.016 | 0.010 |
0.4 | 0.54 | 0.61 | 0.68 | 0.92 | 0.99 | 0.0012 | 無視できるほど小さい | 無視できるほど小さい | 無視できるほど小さい |
答え
p 値
p 値とは、仮説が正しい場合に、手元のデータがどれほど珍しいかを表した確率値でした。仮説に基づいて計算されるわけですから、表の出る確率を 1/2 として計算します。
表と裏に区別はつけず、表が少ない場合と裏が少ない場合の確率を足し合わせます。
表の出た回数 | p 値 |
---|---|
60 | |
55 | |
50 |
検出率
まずは棄却域を求めます。
表の出る確率が 0.5 の段を見ましょう。表の出る回数が 48 回以下の確率は です。表と裏の回数が正反対である、表の回数が 72 回以上の場合と合わせると となります。
一方で、表の出る回数が 49 回以下または 71 回以上となる確率は です。今回は有意水準を 5%、つまり としているので、棄却域は「48 回以下または 72 回以上」となります。
次に検出率を計算します。まずは真の表の出る確率が の場合からです。棄却域に入る確率を計算すればいいので、表の 48 回以下のところと 72 回以上のところを足し合わせれば良く、 と分かります。同様に真の表の出る確率が 0.4 のときは、 と分かります。
真の表の出る確率 | 検出率 |
---|---|
0.49 | 0.04 |
0.4 | 0.54 |
β エラーを引き起こす確率
検出率は、仮説が間違っているときに、それを正しく検出できる (仮説を棄却できる) 確率のことでした。一方で β エラーとは、仮説が間違っているときに、仮説を棄却できないことでした。
したがって以下のような関係にあることがわかります。
したがって 2 問目の結果から以下のように分かります。
真の表の出る確率 | β エラーを引き起こす確率 |
---|---|
0.49 | 0.96 |
0.4 | 0.46 |