適合度検定

この記事の動画解説版はこちら→統計チャンネル

仮定された理論上の確率分布に対して,標本から求めた度数が適合するかどうかを検証する検定を適合度検定という.

観測度数が理論確率分布に適合しているという仮説
\(\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle H_0: P(A_1)=p_1, \cdots, P(A_k)=p_k \)
$\rule[-1mm]{0mm}{7.5mm}$のもとで,近似的に以下が成り立つことが知られている.これをもとに適合度検定を行う.
\(\hspace{5mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \chi^2=\sum_{i=1}^{k}\frac{\left(F_i-np_i\right)^2}{np_i}\sim \chi^2(k-1)\)

統計検定量は (観測値-期待度数)²/(期待度数)という形になっていることに注意しよう.

ある人物に,できるだけランダムに$1$ 桁の数字を$100$ 個言ってもらったところ次のような結果になった.特定の数字が多く出ている傾向にないか,有意水準$5\%$ で検定せよ.

解答はこちら

帰無仮説$H_0$ は「数字が一様に分布している」となる.この仮定のもとで,$0$ から$9$ までの出る確率はそれぞれ$1/10$で,期待度数はそれぞれの数字について$100×1/10=10$ となる.

(観測値-期待度数)²/(期待度数)の和は自由度$10-1=9$の$\chi^2$分布に従う.今回の棄却域は $\chi^2>\chi^2_{0.05}(9)=16.92$ である.実現値を計算すると,

\(\hspace{5mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \chi^2=\frac{(17-10)^2}{10}+\frac{(6-10)^2}{10}+\cdots +\frac{(8-10)^2}{10}=19.4(>16.62)\)

と棄却域に入るから,帰無仮説$H_0$ は棄却される.すなわち数字がランダムに述べられているとは言えないと結論する.

統計学の基礎テキスト

お手元にテキスト(資料)があると学習時により便利です.是非ご利用ください!
・「統計学の基礎」のテキスト一式PDFデータ(記述統計編/確率分布編/推測統計編+付録編)の一括ダウンロード
・問題解答つき

テキスト一式は→こちら(note)

この記事の動画解説版はこちら↓

次の記事はこちら
50 独立性の検定

記事一覧はこちら
統計ブログ(トップページ)