なぜ標本から作られた統計量は自由度が下がるのか

なぜ標本から作られた$\chi^2, t$統計量は自由度が1つ少なくなるのかについて,(1)標本分散が自由度$n-1$の$\chi^2$分布に従うこと,(2)標本平均が自由度$n-1$の$t$分布に従うことについての説明記事です.

\(\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \)
$X_1, X_2, \cdots, X_n$は互いに独立で,同一の正規分布$\mbox{N}(\mu, \sigma^2)$に従うとする.
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \overline{X}=\frac{1}{n}\sum_{i=1}^{n}X_i,\ U^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2$
とおく.表題のことをきちんと示すためには大学の微積分や線形代数の知識を要するので,特別な場合(標本の大きさ$n=2$の場合)として直感的に確認してみよう.
(1) 標本分散の分布を考える.
標本平均との偏差平方和を$\sigma^2$で割ったものを変形する(式が長いので,スマホ環境の方は横画面でご覧ください).

$\hspace{2mm}\rule[-1mm]{0mm}{10.5mm} \displaystyle \frac{(2-1)U^2}{\sigma^2}=\frac{(X_1-\overline{X})^2}{\sigma^2}+\frac{(X_2-\overline{X})^2}{\sigma^2}$
$\hspace{7mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle =\frac{((X_1-\mu)-(\overline{X}-\mu))^2}{\sigma^2}+\frac{((X_2-\mu)-(\overline{X}-\mu))^2}{\sigma^2}$
$\hspace{7mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle =\frac{(X_1-\mu)^2}{\sigma^2}+\frac{(X_2-\mu)^2}{\sigma^2}-2\left(\frac{(X_1-\mu)(\overline{X}-\mu)+(X_2-\mu)(\overline{X}-\mu)}{\sigma^2}\right)+2\frac{(\overline{X}-\mu)^2}{\sigma^2}$
$\hspace{7mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle =\frac{(X_1-\mu)^2}{\sigma^2}+\frac{(X_2-\mu)^2}{\sigma^2}-2\left(\frac{(X_1+X_2-2\mu)(\overline{X}-\mu)}{\sigma^2}\right)+2\frac{(\overline{X}-\mu)^2}{\sigma^2}$ $\hspace{7mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle =\frac{(X_1-\mu)^2}{\sigma^2}+\frac{(X_2-\mu)^2}{\sigma^2}-2\frac{(\overline{X}-\mu)^2}{\sigma^2}$

($X_1+X_2=2\overline{X}$に注意)

ここで$\hspace{0mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle Z_i=\frac{X_i-\mu}{\sigma}\ (i=1,2)$とおくと$Z_1, Z_2$はそれぞれ$\mbox{N}(0,1^2)$に従う確率変数で(ただし,独立ではない),

$\hspace{2mm}\rule[-3mm]{0mm}{8.5mm} \displaystyle \frac{(2-1)U^2}{\sigma^2}={Z_1}^2+{Z_2}^2-2\left(\frac{Z_1+Z_2}{2}\right)^2$
$\hspace{7mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle =\frac{2({Z_1}^2+{Z_2}^2)-(Z_1+Z_2)^2}{2}=\left(\frac{Z_1-Z_2}{\sqrt2}\right)^2$

最終項の$\rule[-1mm]{0mm}{7.5mm} \displaystyle \frac{Z_1-Z_2}{\sqrt2}$は$\mbox{N}(0,1^2)$に従う確率変数であるから,これで
$\hspace{2mm}\rule[-1mm]{0mm}{7.5mm} \displaystyle \frac{(2-1)U^2}{\sigma^2}$が自由度$n-1=1$の$\chi^2$分布に従うことがわかった(一般の$n$でも,$\rule[-1mm]{0mm}{7.5mm} \displaystyle \frac{(n-1)U^2}{\sigma^2}$を$n-1$個の独立な$Y_i\sim\mbox{N}(0,1^2)$の和に変形できることが知られている).

(2) $Z=(\overline{X}-\mu)/\sqrt{\sigma^2/n}\sim \mbox{N}(0,1)$かつ$Y=(n-1)U^2/\sigma^2\sim \chi^2(n-1)$であるから,

$\hspace{2mm} \displaystyle \frac{Z}{\sqrt{Y/n}}=\frac{\overline{X}-\mu}{\sqrt{\sigma^2/n}}\div \sqrt{\frac{(n-1)U^2}{\sigma^2}/(n-1)}=\frac{\overline{X}-\mu}{\sqrt{U^2/n}}$

は自由度$n-1$の$t$分布に従う.
($F$分布の自由度が2標本のサイズから1つずつ下がることも,(1)から説明できる.)

記事一覧はこちら

統計ブログ(トップページ)