よく使う仮説検定一覧(2標本)その2
この記事の動画解説版はこちら→統計チャンネル
これまでに扱いきれなかった問題を2つ扱う.
2標本だが実質1標本となる場合.変数$X,Y$に対応がありその変化に興味があるような状況では$X-Y$を改めて変数として考えて計算する.
問1
あるダイエット法が体重の減量に効果があるかどうかを調べる実験に,10名の20代女性が参加した.このダイエット法の前後での2ヶ月の体重変化をまとめると以下の通りとなった.体重は正規分布に従うとして,このダイエット法は減量に効果があったと言えるかどうかを有意水準5%で検定せよ.
解答はこちら
解
体重の減少量((実施前)-(実施後))を$D$とおくと,$D\sim \mbox{N}(\mu_d, \sigma^2)$.体重が減少したかどうかを検証したいから,
$\hspace{2mm}H_0: \mu_d=0$,$H_1: \mu_d>0$
とすればよい.$H_0$のもとで,
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \overline{D}\sim \mbox{N}\left(0, \frac{\sigma^2}{10}\right)$
すなわち
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle T=\frac{\overline{D}-0}{\sqrt{U^2/10}}\sim t(9)$
棄却域は$t>t_{0.05}(9)=1.833$.実現値は
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle t=\frac{1.56}{\sqrt{3.1/10}}= 2.80\cdots >1.833$
であるから$H_0$を棄却し,$H_1$を採択する.すなわち,ダイエット法には効果があったと結論する.
続いて,比率の差の検定の問題.
問2
多くの動画共有サイトでは,視聴者は各動画内容を説明した画像(サムネイル)を見て,動画を観たい場合はサムネイルをクリックして視聴を開始する.ある特定の動画のサムネイルを見た視聴者から無作為に $600$ 人を抽出したところ,男性 $280$ 人のうち,$28$ 人がクリック,女性 $320$ 人のうち,$56$ 人がクリックしていた.この動画のサムネイルを見た視聴者のうち,クリックする割合が男女間で差があるかどうか,有意水準5%で検定せよ.
解答はこちら
解
サムネイルを見た男性,女性がクリックするかどうかに対応する確率変数をそれぞれ
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle X_{i}\sim \mbox{Be}(p_{A}), Y_{i}\sim \mbox{Be}(p_{B})$
とおく.中心極限定理により,
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \hat{P}_A=\frac{1}{280} \sum_{i=1}^{280}X_{i }\sim \mbox{N}\left(p_{A}\frac{p_{A}(1-p_{A})}{280}\right), $
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \hat{P}_B=\frac{1}{320} \sum_{i=1}^{320}Y_{ i}\sim \mbox{N}\left(p_{B}, \frac{p_{B}(1-p_{B})}{320}\right)$
であるから,
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \frac{(\hat{P}_A-\hat{P}_B)-(p_{A}-p_{B})}{\sqrt{\frac{p_{A}(1-p_{A})}{280}+\frac{p_{B}(1-p_{B})}{320}}}\sim \mbox{N}(0,1)$
となる.クリックする割合が男女間で差があるかどうか検証したいから,
$H_0 : p_{A}-p_{B}=0$,$H_1: p_{A}-p_{B}\not=0$
とすればよい.$H_0$の仮定のもとで,
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle Z=\frac{(\hat{P}_A-\hat{P}_B)}{\sqrt{\frac{p_{A}(1-p_{A})}{280}+\frac{p_{B}(1-p_{B})}{320}}}\sim \mbox{N}(0,1)$
棄却域は$|z|>1.96$.$\hat{p}_A=\frac{28}{280}=0.1$,$\hat{p}_B=\frac{56}{320}=0.175$により実現値を計算すると(分母の母数$p_{A},p_{B}$は$\hat{p}_A, \hat{p}_B$に取り替えて)
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle z=\frac{0.1-0.175}{\sqrt{\frac{0.1(1-0.1)}{280}+\frac{0.175(1-0.175)}{320}}}$
$\hspace{5mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle =-2.69\cdots <-1.96$
よって$H_0$を棄却し,$H_1$を採択する.すなわち,男女間でのクリックする割合には差があると結論する.
(補足) 帰無仮説のもとでは,根号内の$p_A,p_B$を$\hat{p}_A,\hat{p}_B$ではなく,両方の標本比率を統合した
\( \displaystyle \hat{p}^{*}=\frac{n_Ap_A+n_Bp_B}{n_A+n_B}\)
を計算し,これを根号内の$p_A,p_B$の“代用品”として用いる方法もある.今回の例では$600$人中$28+56=84$人がクリックしたのだから統合した標本比率は$\hat{p}^{*}=\frac{28+56}{600}=\frac{7}{50}$となる.これをもとに実現値を計算すると$z=\frac{0.1-0.175}{\sqrt{\frac{7}{50}\left(1-\frac{7}{50}\right)\left(\frac{1}{280}+\frac{1}{320}\right)}}=-2.64\cdots$となってほぼ同じ値を得る.
本ブログ・解説動画に対応した資料です(note)
この記事の動画解説版はこちら↓