Nラボ備忘録

TAKE IT EASY

MENU

統計学入門④ 代表値( Ⅰ )

ここまで統計学で扱うデータの特徴を紹介していきました。
ここではデータを分析する上で、データの代表となる 代表値 について学んでいきます。代表値とはそのデータの集まりを代表するような特別な値のことを言います。
学習するにあたって、とある高校生7人の定期テスト(物理)の点数を使わせていただきましょう。

出席番号 241014192537
点数 10454545657070

それでは7人の点数を使って、代表値を計算していきましょう。

平均値
平均値はよく耳にする言葉だと思います。求め方は以下になります。
① すべてのデータを足す:10 + 45+ 45 + 45 + 65 + 70 + 70 = 350
② 足した結果をデータの個数で割る:350 ÷ 7 = 40

中央値
中央値はどうでしょうか。中央値はその名の通り、"中央にある値"です。求め方は以下になります。
① データを小さい順に並べる:10, 45, 45, 45, 65, 70, 70
② 中央に来るデータが中央値:45
 ただし、今回のようなデータの数が奇数の場合は並べるだけわかりますが、データの数が偶数の場合は、真ん中2つのデータの平均値です。(詳しくはExercise1-3で)

最頻値
最頻値は漢字の意味が分かれば簡単ですね。"最も頻繁に出てくる値"で最頻値です。高校生7人の点数を見れば最頻値は45点とわかります。注意しなければいけないことは、45が3つあるから最頻値は"3"だと勘違いしないことです。
おそらく上記3つの代表値の中で一番簡単に求められると思います。

Exercise1-3 

とある高校生6人の定期テスト(物理)の点数が、 30, 15, 50, 30, 85, 90 だった場合の平均値、中央値、最頻値を求めてみましょう。



ここまでのまとめ 平均値・・・すべてのデータを足して、データの個数で割る
中央値・・・データを小さい順に並べて、中央に来るデータ
      (データ数が偶数の場合は、真ん中のデータ2つの平均値)

最頻値・・・最も頻繁に出てくるデータ