統計的仮説検定超入門!その3

2024-01-15

2 つの記事を通して、統計的仮説検定について解説してきました。

より理解を深めるには、自らの手で計算してみることが肝要です。いくつか計算問題を作ったので、理解度チェックにご活用ください。

問題

問題全体を通じて以下の設定をつかいます。

  • 仮説:コインの表の出る確率は 1/2
  • サンプルサイズ:120

確率値の計算には、下のほうにある確率表を使ってください。

p 値

表の出た回数ごとに、p 値を計算してください。

表の出た回数p 値
60
55
50

検出率

真の表の出る確率ごとに検出率を計算してください。

真の表の出る確率検出率
0.49
0.4

β エラーを引き起こす確率

真の表の出る確率ごとに、β エラーを引き起こす確率を計算してください。

真の表の出る確率β エラーを引き起こす確率
0.49
0.4

確率表

コインの投げる回数は問題全体で 120 回にそろえてあります。

表の出る確率ごとに、表の出る回数がある値以下 (or 以上) となる確率を表にしています。 つまり左上のセルは、「真の表の出る確率が 0.5 である場合に、表の出る回数が 48 回以下となる確率は 0.018 である」という意味です。

表の出る確率 \ 表の回数48 回以下49 回以下50 回以下55 回以下60 回以下65 回以上70 回以上71 回以上72 回以上
0.50.0180.0270.0410.210.540.210.0410.0270.018
0.490.0300.0440.0650.270.620.150.0250.0160.010
0.40.540.610.680.920.990.0012無視できるほど小さい無視できるほど小さい無視できるほど小さい

答え

p 値

p 値とは、仮説が正しい場合に、手元のデータがどれほど珍しいかを表した確率値でした。仮説に基づいて計算されるわけですから、表の出る確率を 1/2 として計算します。

表と裏に区別はつけず、表が少ない場合と裏が少ない場合の確率を足し合わせます。

表の出た回数p 値
6011
550.212=0.410.21 * 2 = 0.41
500.0412=0.0820.041 * 2 = 0.082

検出率

まずは棄却域を求めます。

表の出る確率が 0.5 の段を見ましょう。表の出る回数が 48 回以下の確率は 0.0180.018 です。表と裏の回数が正反対である、表の回数が 72 回以上の場合と合わせると 0.0360.036 となります。

一方で、表の出る回数が 49 回以下または 71 回以上となる確率は 0.0540.054 です。今回は有意水準を 5%、つまり 0.050.05 としているので、棄却域は「48 回以下または 72 回以上」となります。

次に検出率を計算します。まずは真の表の出る確率が 0.490.49 の場合からです。棄却域に入る確率を計算すればいいので、表の 48 回以下のところと 72 回以上のところを足し合わせれば良く、0.040.04 と分かります。同様に真の表の出る確率が 0.4 のときは、0.540.54 と分かります。

真の表の出る確率検出率
0.490.04
0.40.54

β エラーを引き起こす確率

検出率は、仮説が間違っているときに、それを正しく検出できる (仮説を棄却できる) 確率のことでした。一方で β エラーとは、仮説が間違っているときに、仮説を棄却できないことでした。

したがって以下のような関係にあることがわかります。

βエラーの確率=1検出率\beta \text{エラーの確率} = 1 - \text{検出率}

したがって 2 問目の結果から以下のように分かります。

真の表の出る確率β エラーを引き起こす確率
0.490.96
0.40.46