この記事の動画解説版はこちら→統計チャンネル
$X$は試行回数$n$,成功確率$p$の二項分布に従うとする($\displaystyle X\sim \mbox{B}(n,p)$).このとき,互いに独立に成功確率$p$のベルヌーイ分布に従う確率変数$X_1,X_2,\cdots,X_n$を用いて
$\displaystyle X=X_1+X_2+\cdots+X_n$
と表されるから,$X$を$n$で割った確率変数
$\displaystyle \frac{X}{n}=\frac{X_1+X_2+\cdots +X_n}{n}$
は$\mbox{Be})(p)$に従う$n$個の確率変数の標本平均とみなせる.よって中心極限定理により,近似的に
$\displaystyle \frac{X}{n}\sim\mbox{N}\left(p, \frac{p(1-p)}{n}\right)$
となる(ここで$\mbox{Be}(p)$の平均が$p$,分散が$p(1-p)$であることを用いている).すなわち,
$\displaystyle X\sim \mbox{N}\left(np, np(1-p)\right)$
が成り立つ(確率変数を$n$倍したので,平均は$n$倍,分散は$n^2$倍となっている).
一つ例を計算してみよう.上の結果を当てはめるのではなく,もういちど上の結果を導き出すように計算する.
(例)ある試験は問題が全部で50問あり,各問題は○か×の2つの選択肢からなる.ある受験生が各問題ごとにランダムに解答するとき,30問以上正答する確率を求めよ.
正答数を$X$とおくと,$\displaystyle X\sim \mbox{B}(50,1/2)$あるいは$X=X_1+\cdots +X_{50}$ (各$X_i$は互いに独立で$\displaystyle X_i\sim\mbox{Be}(1/2)$)と表される.中心極限定理により,近似的に
$\displaystyle \frac{X}{50}=\frac{X_1+\cdots+X_{50}}{50}\sim \mbox{N}\left(\frac12, \frac{\frac12\left(1-\frac12\right)}{50}\right)$
となる.すなわち
$\displaystyle X\sim \mbox{N}\left(50\cdot\frac12\ ,\ 50^2\cdot\frac{\frac12\left(1-\frac12\right)}{50}\right)$
$=\mbox{N}(25, 12.5)$
標準化すれば
$\displaystyle \frac{X-25}{\sqrt{12.5}}\sim\mbox{N}\left(0,1\right)$
よって求める確率は
$\displaystyle P(X\geqq 30)$
$\displaystyle =P\left(\frac{X-25}{\sqrt{12.5}}\geqq \frac{30-25}{\sqrt{12.5}}\fallingdotseq1.41\right)$
$\displaystyle =0.0793\ (7.93\%)$
ただし最後の確率は標準正規分布の上側確率の数値表から求めた.
(補足)上解答はいったん正答数$X$の従う分布を求めて計算したが,以下のように正答比率$\overline{X}$の分布からそのまま計算することもできる(分母分子を割っただけで本質的に同じ計算.※スマホでは横スクロールします)
により
$\displaystyle \frac{\overline{X}-\frac12}{\sqrt{1/200}}\sim\mbox{N}\left(0,1\right)$
$30/50$以上の比率で正答する確率を求めればよいから,
$\displaystyle P(\overline{X}\geqq \frac{30}{50})$
$\displaystyle =P\left(\frac{\overline{X}-\frac12}{\sqrt{1/200}}\geqq \frac{\frac{30}{50}-\frac12}{\sqrt{1/200}}\fallingdotseq1.41\right)$
$\displaystyle =0.0793\ (7.93\%)$
この記事の動画解説版はこちら↓
前の記事へ戻る 30 大数の法則と中心極限定理 |
次の記事へ 32 歪度と尖度 |
記事一覧へ戻る 統計学の基礎シリーズ 目次 |