Nラボ備忘録

TAKE IT EASY

MENU

統計学入門⑫ 回帰分析(1)

(はじめに)
今まであまり計算では文字式を使わないようにしてきましたが、計算が複雑になってきたので使う場合が増えてくると思います。今更ではありますが、データの変数は$\ x\ $や$\ y\ $、平均値は$\ \bar{x}\ $, $\ \bar{y}\ $、標準偏差は$\ s_{x}\ $, $\ s_{y}\ $、分散は$\ {s_{x}}^2\ $, $\ {s_{y}}^2\ $、共分散は$\ s_{xy}\ $、相関係数は$\ r\ $を使っていきます。その他、新しく出てくるものは都度紹介します。
また当記事のテーマ、趣旨については以下の記事をご覧いただければと思います。

nlab-notebook.com

前回は変動係数$\ CV\ $の求め方を簡単に学びました。

nlab-notebook.com

 今回は話を変えて、$\ $回帰分析$\ $について学び始めようと思います。と言ってもいつも通り初歩的なところだけですが。
 回帰分析とは、(簡単に言えば)2つの変数$\ x\ $、$\ y\ $の間に何らかの関係があると考えたときに $\ x\ $から$\ y\ $を予測することです。このとき$\ x\ $を 説明変数 、$\ y\ $を 被説明変数(目的変数) といいます。$\ x\ $は「$\ y\ $を説明する変数」で、$\ y\ $は「$\ x\ $によって説明される変数」ということになります。
 ここで言っている「何らかの関係」について、あるアイスクリーム店の「1ヶ月間の売り上げ」と「その月の最高気温」の関係を具体例にして考えていきます。
下の表は1〜12月まで最高気温と売り上げをまとめた表です。ただし、10月の売り上げに関してはデータを消去してしまいました(という設定にしておきます)。

123456789101112
最高気温 (℃) 121315182528333027231814
売り上げ (万円) 303235405060756555?3630
続いて横軸を月毎の最高気温$\ x\ $、縦軸を月毎の売り上げ$\ y\ $としてグラフを書いてみます。

このグラフから最高気温$\ x\ $と月毎の売り上げ$\ y\ $の関係は

$ y = \alpha + \beta x $

で表せることができると考えられます。この直線のことを 回帰直線 といいます。 また$\ \alpha\ $と$\ \beta\ $を 回帰係数 といいます。

それでは、ここまでの復習として問題を解いていきます。

Exercise1-11 

下の文章中の($\ $)に当てはまる言葉を考えてみましょう。

 2つの変数$\ x\ $と$\ y\ $が何らかの関係を持つと考えたとき、$\ x\ $から$\ y\ $の値を予測することを(ア)という。 ここで$\ x\ $は(イ)、$\ y\ $は(ウ)と呼ばれる。
$\ x\ $と$\ y\ $の関係が直線の式$\ y=\alpha + \beta x\ $で表せるとき、この直線を(エ)という。 ここで、$\ \alpha\ $と$\ \beta\ $を(オ)という。

ここまでのまとめ 回帰分析
2つの変数$\ x\ $と$\ y\ $に何らかの関係があると考えたとき、$\ x\ $から$\ y\ $を予測すること。

説明変数
変数$\ x\ $のこと。何らかの原因である変数

被説明変数(目的変数)
変数$\ y\ $のこと。つまり予測したい値のこと。


次回は、回帰係数$\ \alpha\ $と$\ \beta\ $の推定値$\ \hat{\alpha}\ $と$\ \hat{\beta}\ $の求め方を学んでいきます。
最近色々とやりたいことがあって更新が遅いので、いつになるかわかりませんが・・・。

ちなみにですが、私はこちらの参考書で勉強しています。


※Amazonのアソシエイトとして、当メディア(Nラボ備忘録)は適格販売により収入を得ています。

大したブログではないですが、読者になっていただければ嬉しいです。Twitterも始めているのでフォローよろしくお願いします。