中央値,最頻値

この記事の動画解説版はこちら→統計チャンネル

観測値を小さい順にならべたとき,ちょうど真ん中に位置する値を中央値という.観測値が偶数個のときは,中央の2値の平均を中央値とする.

また,最も観測された観測値を最頻値またはモードという.度数分布表が与えられたときは,度数が最も大きい階級の階級値を最頻値とする(度数分布表の場合,度数が最も大きい階級の階級自体を最頻階級とするなど,最頻値に関しては定義の仕方が色々ある)

(例)5軒のラーメン店について,主力ラーメンの値段(円)

500, 500, 500, 500, 2000

平均は800,中央値は500,最頻値は500となる.

上の例のように,観測値の中に極端に大きな値または極端に小さな値(外れ値)があるとき,平均はその影響を受けやすいが、中央値や最頻値は影響を受けにくい傾向がある.

次のデータの平均は$5.5$,最頻値は$4$である.中央値を求めよ.

$4, 8, 8, x, y, z\ (x\leqq y\leqq z)$

解答はこちら

$4.5$

(解説)$4$が最頻値であるから,$x,y,z$のうち少なくとも$2$つは$4$である.$3$つとも$4$であるとすると,データの平均が$(4\cdot 4+8\cdot2)/6=5.3\cdots$となって仮定に反するから$x,y=4, z\not=4$である.ここで平均が$5.5$であることから$(4\cdot 3+8\cdot 2+z)/6=5.5,$よって$z=5$となる.データを小さい順に並べると
$4,4,4,5,8,8$
となるから中央値は$\frac{4+5}{2}=4.5$

統計学の基礎テキスト

お手元にテキスト(資料)があると学習時により便利です.是非ご利用ください!
・「統計学の基礎」のテキスト一式PDFデータ(記述統計編/確率分布編/推測統計編+付録編)の一括ダウンロード
・問題解答つき

テキスト一式は→こちら(note)

この記事の動画解説版はこちら↓

次の記事はこちら
05 四分位数,箱ひげ図

記事一覧はこちら
統計ブログ(トップページ)