標本の大きさ問題

この記事の動画解説版はこちら→統計チャンネル

信頼区間の幅が,指定された長さ以下になるような標本の大きさを求める問題は不等式で計算する.

ここでは,最もよく用いる母比率$p$の区間推定について述べる.母比率$p$の$95\%$信頼区間は

\(\hspace{2mm} \displaystyle \hat{p}-z_{0.025}\!\cdot\!\sqrt{\frac{p(1-p)}{n}}\leqq p \leqq \hat{p}+z_{0.025}\!\cdot\! \sqrt{\frac{p(1-p)}{n}} \)


と表される.例えば,この信頼区間の長さが10%以下($0.1$以下)になるようにしたければ
 \( \displaystyle 2\cdot z_{0.025}\cdot \sqrt{\frac{p(1-p)}{n}}\leqq 0.1\)
すなわち
 \( \displaystyle n\geqq \left(\frac{2\cdot z_{0.025}\sqrt{p(1-p)}}{0.1}\right)^2\)
とすればよい.事前に$p$のとりうる範囲が分かっている場合は,上式右辺が最も大きくなるような$p$の値を代入する.$p$の事前情報がない場合は(上式右辺がもっとも大きくなる)$p=0.5$を代入して計算する.事前情報がない場合は
 \( \displaystyle n\geqq \left(\frac{2\cdot1.96\cdot 0.5}{0.1}\right)^2=3 84.16 \)
よって標本の大きさは$385$以上とすればよい.

A県において,ある特定銘柄の洗剤を使っている世帯比率$p$について,$95\%$ 信頼区間の幅が $0.05$ 以下になるように調査したい.次の場合,少なくとも何世帯に調査する必要があるか.十の位を切り上げた概数で答えよ.
(1) 母比率 $p$ について何も分かっていない場合
(2) 母比率 $p$ は高くても $25\%$ であることがわかっている場合

解答はこちら

(1) $2\cdot z_{0.025}\cdot \sqrt{\frac{p(1-p)}{n}}\leqq 0.05$により
 $n\geqq \left(\frac{2\cdot 1.96\sqrt{p(1-p)}}{0.05}\right)^2$…(①)
根号の中は$p=0.5$のとき最大になるから,
 $n\geqq \left(\frac{2\cdot 1.96\cdot 0.5}{0.05}\right)^2=1536.6\cdots $
よって,少なくとも$1540$世帯に調査する必要がある.
(2) $p\leqq 0.25$により,①の根号の中は$p=0.25$のとき最大になるから
 $n\geqq \left(\frac{2\cdot 1.96\sqrt{0.25\cdot 0.75}}{0.06}\right)^2=1152.4\cdots $
よって,少なくとも$1160$世帯に調査する必要がある.

本ブログ・解説動画に対応した資料です(note)

この記事の動画解説版はこちら↓

前の記事へ戻る
40 よく使う区間推定一覧(1標本)
次の記事へ
42 よく使う区間推定一覧(2標本)
記事一覧へ戻る
統計学の基礎シリーズ 目次