仮説検定の一般的な手順

この記事の動画解説版はこちら→統計チャンネル

仮説のもとで,実現値が統計的に極端な値かどうか判断し,極端な場合は仮説を否定することで統計的な主張を行うのが仮説検定である.例題を通して,仮説検定の手順を紹介する.

(例)機械Aが製造するある部品の重量は平均$\mu=9.5$ (g)の正規分布に従うとされていたが,最近になって製造方法に変更を加えたところ,重量が大きくなったという報告が上がった.そこで,この部品について7個を無作為に選び,重量(g)を計測すると,以下の通りになった.製造方法の変更で平均 $\mu$ の値が $9.5$ より増大したといえるかどうかを有意水準5%で検定せよ.なお,母分散は$\sigma^2=0.7^2$とせよ.

(STEP 0) 最初に有意水準を設定

「有意水準$5\%$で検定せよ」との問題文の指定により,有意水準は$5\%$とする(STEP3の棄却域の設定で基準として用いる).

(STEP1) 母集団分布と,興味のある母数の確認に加えて,帰無仮説と対立仮説を設定

今回の母集団分布は正規分布$\mbox{N}(\mu, 0.7^2)$,最終的には$\mu$が$9.5$より大きいと言えるか知りたい状況である.そこで,帰無仮説を$\mu=9.5$,対立仮説を$\mu>9.5$と設定する.

仮説についての補足(クリック)

帰無仮説$H_0$は統計量を計算する都合もあり,通常は「母数=具体的な値」のように等号の形で用いられる.また,対立仮説は主張したいことを設定することが多く,帰無仮説の否定となるように設定する(ただ以下述べるように,数学的な意味の否定とは少し異なる場合もある).

対立仮説$H_1$は,主張したいことによって片側または両側に設定する.
・母平均が $9.5$ より大きいかを検証したいとき(今回の場合)
 →対立仮説は$\mu>9.5$ (片側)
・母平均が $9.5$ に等しいかどうかを検証したいとき
 →対立仮説は$\mu\not= 9.5$ (両側)

(STEP 2)帰無仮説$H_0$のもとで,興味のある母数を含む統計量の分布を調べる

今回は平均重量(母平均$\mu$)に興味があるので,標本平均の分布を確認する.

使う推定量についての補足(クリック)

よく使用する推定量は以下の通り(区間推定の場合とまったく同じである)

母平均$\mu$の推定なら 標本平均$\overline{X}$
母分散$\sigma^2$の推定なら (標本)不偏分散$U^2$
母比率$p$の推定なら 標本比率$\hat{P}$

 $ \displaystyle \overline{X}=\frac{X_1+X_2+\cdots +X_7}{7}\sim \mbox{N}\left(\mu, \frac{\sigma^2}{7}\right)$

標準化すれば $ \displaystyle Z=\frac{\overline{X}-\mu}{\sqrt{\sigma^2/7}}\sim \mbox{N}(0,1)$

よって帰無仮説の仮定のもとでは
$ \hspace{5mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle Z=\frac{\overline{X}-9.5}{\sqrt{\sigma^2/n}}\sim \mbox{N}(0,1)$

統計量についての補足(クリック)

最後の式$ \displaystyle Z=\frac{\overline{X}-9.5}{\sqrt{\sigma^2/n}}\sim \mbox{N}(0,1)$のように,
「(推定量を含む式) $\sim$ (よく分かっている分布)」
の形になるように変形するとよい(帰無仮説の仮定があるので,統計量内の母数があった箇所は具体的な数値に置き換えられる).またよく分かっている分布とは,母数を含まず,数値表などで確率の計算ができるような分布のこと.

また,(STEP 0〜STEP 2)は通常はもっと簡素に記述される.

(STEP 3)棄却域の設定と実現値のを計算し,結論する

棄却域は$z\geqq 1.645 (=z_{0.05})$となる.

棄却域についての補足(クリック)

統計量の分布のうち,“極端な側”確率5%(有意水準)の位置に対応する区間を棄却域として設定.対立仮説が $\mu\not=9.5$ の場合は両側に $2.5\%$ ずつ設定.

$\hspace{5mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle z=\frac{9.8-9.5}{\sqrt{0.7^2/7}}=1.13\cdots (<1.645)$

この値は棄却域に含まれない($1.645$未満)ので,有意水準$5\%$で$H_0$は棄却されない.すなわち製造方法の変更で平均が$9.5$(g)より増大したとは言えない.

結論についての補足(クリック)

実現値を計算して棄却域に入る場合(棄却域に落ちるなどとも表現する)は,$H_0$の仮定のもとで極端な値が発生したのだから$H_0$の仮定には無理がある,ということで$H_0$の仮定を否定(棄却という)し,対立仮説$H_1$の主張を認める($H_1$を採択する)ことにする.これは統計的に信頼性のある結論であり,「製造方法の変更で平均が増大した」などと表現する.

反対に,実現値が棄却域に入らない場合は,$H_0$の仮定のもとで特におかしなことは起きなかったということであるから,統計的に何も言えないことになる.この場合は統計的に信頼性のない結論であり,「製造方法の変更で平均が増大したとはいえない」などと曖昧に表現する(増大したとは言えないが,かといって変化がないことを強く主張しているわけでもない).

まとめると,実現値について
・棄却域に入るとき
 →$H_0$を棄却し,$H_1$を採択する
  (信頼性がある強い結論)
・棄却域に入らないとき
 →$H_0$を採択(受容する)
  (信頼性がない弱い結論)

何回も繰り返し行うことができるゲームがあり,$1$ 回ごとに常に $1/4$ の確率で当たりが出るとされている.このゲームを $20$ 回行ったところ,当たりは $1$ 回であった.この結果を受けて,ゲームの当たる確率は $1/4$ より小さいと判断できるか,有意水準 $5\%$ で検定せよ.ただし,以下二項分布の表を利用してよい.

試行回数$20$,成功確率$1/4$の二項分布$\displaystyle  \mbox{B}\left(20,\frac14\right)$

解答はこちら

当たる確率$p$が$1/4$より小さいか検証したいのだから,帰無仮説$H_0: p=1/4$,対立仮説$H_1: p<1/4$とすればよい.$20$回ゲームを行って当たる回数を$X$とすると,帰無仮説のもとで$ X\sim \mbox{B}(20,1/4)$となる.上の分布表により$P(X\leqq a)\leqq0.05$となる一番大きい$a$は$a=1$である.よって有意水準$5\%$での棄却域は$x\leqq 1$となり,今回の実現値$x=1$はこの棄却域に含まれる.よって帰無仮説を棄却し,対立仮説を採択する.すなわち,このゲームの当たる確率は$1/4$よりも小さいと結論する.

本ブログ・解説動画に対応した資料です(note)

この記事の動画解説版はこちら↓

前の記事へ戻る
42 よく使う区間推定一覧(2標本)
次の記事へ
44 よく使う仮説検定一覧(1標本)
記事一覧へ戻る
統計学の基礎シリーズ 目次