標本

この記事の動画解説版はこちら→統計チャンネル

研究や調査の対象となっている集合を母集団という.統計学では,母集団の分布を知るために,平均$\mu$,分散$\sigma^2$,比率$p$といった分布の情報を表す値,すなわち母数を調べようとする.母数であることを強調したいときは母平均など「母」をつけて表現し、また記号では原則小文字で表記される.母数を調べるためには母集団全体についてもれなく調べる方法(全数調査)もあるが,一般に大きな手間や費用がかかってしまう.そこで多くの場合は,標本とよばれるサイズの小さい集合を母集団から取り出し(抽出という),統計的な考察を行うことになる.一般に標本の関数(標本$X_1,\cdots X_n$から作られた式)を統計量といい,特に母数を推定するための統計量を推定量という.統計量(推定量)は実際の値が代入されたときは実現値(推定値)とよび,原則小文字で表す(実際にはこの大文字・小文字の区別は厳密には行われていないので,文脈で判断することも多い).

標本は母集団を反映する縮図になっていることが望ましいが,抽出したものである以上,一般に母集団との誤差が生じる.標本を利用することに由来する誤差を標本誤差という.全数調査でない限り,標本誤差はふつう発生するものであるが,適切な標本設計により数値で評価することができる.一方,母集団とズレた集団からの抽出,回答拒否や誤回答,集計ミスなど標本誤差以外の誤差は非標本誤差と呼ばれ,一般に数値評価が難しいとされる.

(非標本誤差の例)
・インターネットのみを使った調査←インターネットを使用しない世帯について調査ができない(非標本誤差の中でもカバレッジ誤差という)
・質問の意味が分かりにくかったり紛らわしかったりして,回答者が面倒に感じて回答を止めたり誤った回答を行ってしまう
・資産などの調査において,資産が多い世帯が実際よりも少ない金額を申告する
・回答データを集計する際に,パソコンに誤った番号を入力してしまう

次の文章の空欄に適する語句を選択肢から選べ.ただし,同じものを何度選んでもよい.

一般に,研究や調査の目的となっている対象全体の集まりを( ① )といい,具体的にデータが観測される母集団の一部を( ② )という.
標本調査に伴う誤差には( ③ )誤差と( ④ )誤差の2種類がある.前者は全数調査をせずに標本を作って調査をしていることにより生じているための誤差で,適切な標本設計により数値で評価することができる.後者の誤差は,調査への非回答集団の存在や調査票への記入ミスなど標本調査を理由としない原因から発生する誤差である.調査票における質問項目や質問文を工夫することで非標本誤差を小さくすることが重要である.

【選択肢】母集団,標準,標本,非標本

解答はこちら

①母集団 ②標本 ③標本 ④非標本

本ブログ・解説動画に対応した資料です(note)

この記事の動画解説版はこちら↓

前の記事へ戻る
32 歪度と尖度
次の記事へ
34 抽出方法
記事一覧へ戻る
統計学の基礎シリーズ 目次