データの分析

共分散の求め方をサクッと解説!!

「共分散の公式は?」
「共分散の求め方が分からない」
今回は共分散についての悩みを解決します。

高校生
共分散が苦手なんです...

共分散とは、「2組の対応するデータ間の関係を表す数値」です。

xとyの共分散\(s_{xy}\)は次の公式で求める

\(\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n (x_i -\overline{x})(y_i -\overline{y})\)

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

 

本記事では、共分散の意味や求め方について解説します。

分散が分かればすぐ理解できるのでしっかり理解しておきましょう!

記事の内容

データの分析のまとめ記事へ

共分散とは?

共分散とは、「2組の対応するデータ間の関係を表す数値」です。

それに対して、分散は1つのデータの散らばり度合いを示す数値でした。

 

共分散を求めることで、

「数学の点数が高いと英語の点数も高いのか?」
「2つのデータに関係性はないのか?」

そんなことを分析することができます。

共分散の求め方

共分散は、「xの偏差×yの偏差」の平均で求めます。

偏差とは「データ値と平均値との差」を指します。
⇒詳しくは「偏差値の意味と求め方」で解説しています。

共分散の求め方xとyの共分散\(s_{xy}\)は次の公式で求める

\(\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n (x_i -\overline{x})(y_i -\overline{y})\)

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

文字で解説されても分かりづらいと思うので、具体例を見てみましょう。

5人が数学と英語のテストを受けたとします。
x:数学の点数  y:英語の点数それぞれの点数は
(x,y)=(40,50)(50,60)(60,80)(70,60)(80,100)この時の共分散を求めます。

共分散の求め方

やることは大きく3つのステップです。

共分散を求めるステップ

  1. x,yの平均値を求める
  2. それぞれの偏差を求める
  3. 偏差の積の平均値を求める

1.x,yの平均値を求める

x,yの平均値を求めたものが以下の表です。

共分散の求め方

平均値の求め方はこちら


 

2.それぞれの偏差を求める

平均値が求められたら、それぞれの偏差を求めます。

偏差の計算

偏差=(データ値)ー(平均値)

共分散の求め方

 

3.偏差の積の平均値を求める

最後にそれぞれの偏差を掛け合わせた平均を求めるとそれが共分散です。

共分散の求め方

共分散の簡単な求め方

共分散を求める公式はもう1つあります。

共分散公式xとyの共分散\(s_{xy}\)は次の公式で求める

\(\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n x_i y_i - \overline{xy}\)

nはデータの総数
\(x_i y_i\)は個々の積の数値
\(\overline{xy}\)は平均値の積

では、共分散公式を用いて共分散を求めてみましょう。

共分散の簡単な求め方

 

x,yの平均値は\((\overline{x},\overline{y})=(60,70)\)なので、\(\overline{xy}=4200\)

次に積の平均を求めます。

共分散の簡単な求め方

\(\displaystyle \frac{1}{n} \sum_{i=0}^n x_i y_i =4400\)
\(\overline{xy}=4200\)

したがって共分散は、

\(\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n x_i y_i - \overline{xy}\)
\(=4400 -4200\)
\(=200\)

となり、比較的簡単に共分散を求めることができました。

データの分析のまとめ記事へ

共分散の値と符号の意味

共分散の値が何を意味するのか解説します。

共分散の符号

共分散の値が大きい⇒xが大きい時、yも大きい
共分散が0⇒xとyの間に関係が見られない
共分散の値が小さい⇒xが大きい時、yは小さい

共分散の符号が正の時は相関の関係で、負の時は逆相関の関係が見られることを意味します。

共分散を表す記号

共分散は英語で「Covariance」というので、xとyの共分散をCov(x,y)と書きます。

また、\(σ_{xy}\)と書くこともあります。

 

共分散は「xの偏差×yの偏差」の平均でした。

平均値(期待値)を意味するEを用いて、

\(E[(x-\overline{x})(y-\overline{y})]\)

と表すこともあります。

共分散の注意点

共分散の注意点としては、扱っているデータの値が大きいと共分散の値も大きくなる点です。

共分散の値が大きいからといって2つのデータ間に強い相関の関係があるとは限りません。

(x,y)=(40,50)(50,60)(60,80)(70,60)(80,100)
⇒共分散 200(x,y)=(400,500)(500,600)(600,800)(700,600)(800,1000)
⇒共分散 20000

 

この注意点を解決してくれるのが相関係数です。

相関係数については「相関係数の意味と求め方」でまとめています。

相関係数
相関係数の意味と求め方を分かりやすく解説!
相関係数の意味と求め方を分かりやすく解説!

「相関係数って何を表してるの?」 「相関係数の ...

続きを見る

共分散<練習問題>

共分散<練習問題>

共分散を使った練習問題に挑戦してみましょう。

練習問題あるクラスで数学と国語のテストを行いました。
x:数学の点数  y:国語の点数\((x,y)=(30,40)(40,40)(50,70)(80,70)(100,80)\)
この共分散を求めよ。

共分散<練習問題>

では、共分散の練習問題に取り掛かっていきます。

共分散を求めるステップ

  1. x,yの平均値を求める
  2. それぞれの偏差を求める
  3. 偏差の積の平均値を求める

1.x,yの平均値を求める
共分散<練習問題>

 

2.それぞれの偏差を求める
共分散<練習問題>

 

3.偏差の積の平均値を求める
共分散<練習問題>

したがって、求める共分散は380である。

共分散 まとめ

今回はデータの分析から最頻値についてまとめました。

最頻値 まとめ

共分散とは?
⇒2組の対応するデータ間の関係を表す数値

共分散の公式


xとyの共分散\(s_{xy}\)は次の公式で求める

\(\displaystyle s_{xy}=\frac{1}{n} \sum_{i=0}^n (x_i -\overline{x})(y_i -\overline{y})\)

nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値

共分散を求めるステップ

  1. x,yの平均値を求める
  2. それぞれの偏差を求める
  3. 偏差の積の平均値を求める

共分散の符号
 共分散の値が大きい⇒xが大きい時、yも大きい
共分散が0⇒xとyの間に関係が見られない
共分散の値が小さい⇒xが大きい時、yは小さい

共分散と合わせて「分散」や「相関係数」も確認しておきましょう。
まだチェックしていない方はぜひご覧ください。

分散
分散とは?分散の公式と求め方
分散とは?分散の公式と求め方を解説!標準偏差や共分散との違いは?

「分散ってなんだっけ?」 「分散の求め方が分か ...

続きを見る

相関係数
相関係数の意味と求め方を分かりやすく解説!
相関係数の意味と求め方を分かりやすく解説!

「相関係数って何を表してるの?」 「相関係数の ...

続きを見る

それでは最後まで読んでくださりありがとうございました。

あなたの努力が報われますように!

データの分析のまとめ記事へ

2021年映像授業ランキング

スタディサプリ

会員数157万人の業界No.1の映像授業サービス。
月額2,178円で各教科のプロによる授業が受け放題!分からないところだけ学べるので、学習効率も大幅にUP!
本気で変わりたいならすぐに始めよう!

河合塾One

基本から学びたい方には河合塾Oneがおすすめ!
AIが正答率を判断して、あなただけのオリジナルカリキュラムを作成してくれます!
まずは7日間の無料体験から始めましょう!

おすすめ記事

偏差値40から60に上げたぼくの勉強法 1

「勉強してるのに成績が上がらない」 「テスト当 ...

【2021年】おすすめ映像授業5選を徹底比較!《高校生向け》 2

  いますぐ始めたい方へ⇩当記事で人 ...

【無料体験あり】AmazonKindleなら参考書が読み放題!いますぐ始めよう! 3

Amazonで参考書が無料で読めるって知ってい ...

-データの分析
-, ,

© 2021 マストラ高校数学まとめサイト