こんにちは、ゆうやです。
今回は共分散に関する悩みを解決していきます。
- 共分散ってなに?
- 共分散は何を表してるの?
- 共分散の求め方は?
データの問題では相関係数の前に共分散を求める問題が多いです。
分散が分かれば共分散は余裕なので、しっかり理解しておきましょう!

今回は共分散の意味に加え、共分散の求め方と練習問題も紹介します。
・共分散とは?
・共分散の求め方
・共分散の簡単な求め方
・共分散の符号の意味
・共分散を表す記号
・共分散の注意点
・共分散<練習問題>
数学講師歴5年
担当した生徒の数は100人以上
高校数学を網羅するサイト作成中
共分散とは?
共分散とは、「2組の対応するデータ間の関係を表す数値」です。
分散は「数学のテスト結果」など1つのデータの散らばり度合いを示す数値でした。
それに対して、共分散は「数学のテスト結果」と「英語のテスト結果」の2つのデータ間にある関係を示す数値です。
共分散を求めることで、
数学の点数が高いと英語の点数も高いのか?
それとも、2つのデータに関係性はないのか?
そんなことを分析することができます。
共分散の求め方
共分散は、「xの偏差×yの偏差」の平均で求めます。
偏差とは、データ値と平均値との差を指します。
⇒偏差値とは?偏差値の意味と求め方をズバリ解説します!
nはデータの総数
\(x_i\)と\(y_i\)は個々の数値
\(\overline{x}\)と\(\overline{y}\)はそれぞれの平均値
文字で解説されても分かりづらいと思うので、具体例を見てみましょう。
x:数学の点数 y:英語の点数
それぞれの点数は
(x,y)=(40,50)(50,60)(60,80)(70,60)(80,100)
この時の共分散を求めます。
やることは大きく3つのステップ
- x,yの平均値を求める
- それぞれの偏差を求める
- 偏差の積の平均値を求める
1.x,yの平均値を求める
x,yの平均値を求めたものが以下の表です。
平均値の求め方は別の記事でまとめています
⇒平均値とは?平均値の意味と中央値との違いを解説
2.それぞれの偏差を求める
平均値が求められたら、それぞれの偏差を求めます。
3.偏差の積の平均値を求める
最後にそれぞれの偏差を掛け合わせた平均を求めるとそれが共分散です。
共分散の簡単な求め方
共分散を求める公式はもう1つあります。
nはデータの総数
\(x_i y_i\)は個々の積の数値
\(\overline{xy}\)は平均値の積
では、共分散公式を用いて共分散を求めてみましょう。
x,yの平均値は\((\overline{x},\overline{y})=(60,70)\)なので、\(\overline{xy}=4200\)
次に積の平均を求めます。
\(\displaystyle \frac{1}{n} \sum_{i=0}^n x_i y_i =4400\)
\(\overline{xy}=4200\)
したがって共分散は、
\(\displaystyle s_(xy)=\frac{1}{n} \sum_{i=0}^n x_i y_i - \overline{xy}\)
\(=4400 -4200\)
\(=200\)
となり、比較的簡単に共分散を求めることができました。
共分散の値と符号の意味
共分散の値が何を意味するのか解説します。
共分散の値が大きい⇒xが大きい時、yも大きい
共分散が0⇒xとyの間に関係が見られない
共分散の値が小さい⇒xが大きい時、yは小さい
共分散の符号が正の時は相関の関係で、負の時は逆相関の関係が見られることを意味します。
相関の関係については別の記事でまとめています
⇒
共分散を表す記号
共分散は英語で「Covariance」というので、xとyの共分散をCov(x,y)と書きます。
また、\(σ_{xy}\)と書くこともあります。
共分散は「xの偏差×yの偏差」の平均でした。
平均値(期待値)を意味するEを用いて、
\(E[(x-\overline{x})(y-\overline{y})]\)
と表すこともします。
共分散の注意点
共分散の注意点としては、扱っているデータの値が大きいと共分散の値も大きくなる点です。
共分散の値が大きいからといって2つのデータ間に強い相関の関係があるとは限りません。
⇒共分散 200
(x,y)=(400,500)(500,600)(600,800)(700,600)(800,1000)
⇒共分散 20000
この注意点を解決してくれるのが相関係数です。
相関係数については別の記事でまとめています。
共分散<練習問題>
共分散を使った練習問題に挑戦してみましょう。
x:数学の点数 y:国語の点数
\((x,y)=(30,40)(40,40)(50,70)(80,70)(100,80)\)
共分散を求めよ。
では、共分散の練習問題に取り掛かっていきます。
- x,yの平均値を求める
- それぞれの偏差を求める
- 偏差の積の平均値を求める
1.x,yの平均値を求める
2.それぞれの偏差を求める
3.偏差の積の平均値を求める
したがって、求める共分散は380である。
共分散 まとめ
今回はデータの分析から共分散についてまとめました。
2組の対応するデータ間の関係を表す数値
- x,yの平均値を求める
- それぞれの偏差を求める
- 偏差の積の平均値を求める
共分散の符号の意味
共分散の値が大きい⇒xが大きい時、yも大きい
共分散が0⇒xとyの間に関係が見られない
共分散の値が小さい⇒xが大きい時、yは小さい
他にも、教科書に内容に沿った解説記事を挙げています。
お気に入り登録して定期試験前に確認してください。
質問や相談もtwitter(@math_travel)の方に連絡ください。
最後まで読んでくださりありがとうございました。
みんなの努力が報われますように!
【2020年12月】
順位 | 1位 | 2位 | 3位 |
---|---|---|---|
名称 | スタディサプリ![]() | トライイット![]() | 進研ゼミ![]() |
対象 | 小・中・高 | 中・高 | 小・中・高 |
特徴 | 圧倒的コスパの良さ 40,000本の授業が見放題 | 無料でこんなにいいの!? ハイクオリティな授業 | 学習塾業界シェア率1位 個別カリキュラム |
料金 | 月額1,980円で見放題 (ベーシックプラン) | 無料 (一部有料) | 月額10,410円 高校講座5教科 |
公式 | スタディサプリ公式 | トライイット | 進研ゼミ |
現在の会員数は120万人を超えており人気No.1です!
人気の理由は圧倒的なコスパの良さです!
2 各分野のプロの授業が受け放題
3 1授業15分~で手軽に学習
4 場所に縛られない学習スタイル
5 自分に合ったレベルの授業が選べる
6 長期休みの特別講習も充実
7 共通テスト、志望校対策もバッチリ
スタディサプリは14日間の無料体験を実施しています。
お気軽に体験から始めてみてはいかがでしょうか。