二項分布の正規分布近似

この記事の動画解説版はこちら→統計チャンネル

$X$は試行回数$n$,成功確率$p$の二項分布に従うとする($\displaystyle X\sim \mbox{B}(n,p)$).このとき,互いに独立に成功確率$p$のベルヌーイ分布に従う確率変数$X_1,X_2,\cdots,X_n$を用いて

 $\displaystyle X=X_1+X_2+\cdots+X_n$

と表されるから,$X$を$n$で割った確率変数

 $\displaystyle \frac{X}{n}=\frac{X_1+X_2+\cdots +X_n}{n}$

は$\mbox{Be})(p)$に従う$n$個の確率変数の標本平均とみなせる.よって中心極限定理により,近似的に

 $\displaystyle \frac{X}{n}\sim\mbox{N}\left(p, \frac{p(1-p)}{n}\right)$ 

となる(ここで$\mbox{Be}(p)$の平均が$p$,分散が$p(1-p)$であることを用いている).すなわち,

 $\displaystyle X\sim \mbox{N}\left(np, np(1-p)\right)$ 

が成り立つ(確率変数を$n$倍したので,平均は$n$倍,分散は$n^2$倍となっている).

一つ例を計算してみよう.上の結果を当てはめるのではなく,もういちど上の結果を導き出すように計算する.

(例)ある試験は問題が全部で50問あり,各問題は○か×の2つの選択肢からなる.ある受験生が各問題ごとにランダムに解答するとき,30問以上正答する確率を求めよ.

正答数を$X$とおくと,$\displaystyle X\sim \mbox{B}(50,1/2)$あるいは$X=X_1+\cdots +X_{50}$ (各$X_i$は互いに独立で$\displaystyle X_i\sim\mbox{Be}(1/2)$)と表される.中心極限定理により,近似的に

$\displaystyle \frac{X}{50}=\frac{X_1+\cdots+X_{50}}{50}\sim \mbox{N}\left(\frac12, \frac{\frac12\left(1-\frac12\right)}{50}\right)$

となる.すなわち

 $\displaystyle X\sim \mbox{N}\left(50\cdot\frac12\ ,\ 50^2\cdot\frac{\frac12\left(1-\frac12\right)}{50}\right)$
   $=\mbox{N}(25, 12.5)$

標準化すれば

 $\displaystyle \frac{X-25}{\sqrt{12.5}}\sim\mbox{N}\left(0,1\right)$

よって求める確率は

$\displaystyle P(X\geqq 30)$
  $\displaystyle =P\left(\frac{X-25}{\sqrt{12.5}}\geqq \frac{30-25}{\sqrt{12.5}}\fallingdotseq1.41\right)$
  $\displaystyle =0.0793\ (7.93\%)$

ただし最後の確率は標準正規分布の上側確率の数値表から求めた.

(補足)上解答はいったん正答数$X$の従う分布を求めて計算したが,以下のように正答比率$\overline{X}$の分布からそのまま計算することもできる(分母分子を割っただけで本質的に同じ計算.※スマホでは横スクロールします)

$\displaystyle \overline{X}=\frac{X_1+\cdots+X_{50}}{50}\sim \mbox{N}\left(\frac12, \frac{\frac12\left(1-\frac12\right)}{50}\right)=N\left( \frac12, \frac{1}{200}\right)$

により

 $\displaystyle \frac{\overline{X}-\frac12}{\sqrt{1/200}}\sim\mbox{N}\left(0,1\right)$

$30/50$以上の比率で正答する確率を求めればよいから,

$\displaystyle P(\overline{X}\geqq \frac{30}{50})$
  $\displaystyle =P\left(\frac{\overline{X}-\frac12}{\sqrt{1/200}}\geqq \frac{\frac{30}{50}-\frac12}{\sqrt{1/200}}\fallingdotseq1.41\right)$
  $\displaystyle =0.0793\ (7.93\%)$

本ブログ・解説動画に対応した資料です(note)

この記事の動画解説版はこちら↓

前の記事へ戻る
30 大数の法則と中心極限定理
次の記事へ
32 歪度と尖度
記事一覧へ戻る
統計学の基礎シリーズ 目次