相関とは?相関係数と「相関≠因果」をやさしく図解
「気温が上がると、アイスが売れる」「勉強時間が増えると、点数が上がる」——こんなふうに、2つの量が一緒に動く関係を、統計では相関といいます。
相関は、データ分析でいちばんよく使う考え方の一つで、回帰分析の入り口でもあります。ただし、ひとつ超重要な落とし穴が——「**相関があっても、原因と結果とは限らない**」。この連載第3回で、相関の測り方と、その大事な注意点を押さえましょう。
統計のきほんは、回帰分析やデータ分析を正しく使うための土台です。この連載を押さえておくと、回帰の結果も“なんとなく”ではなく“意味が分かって”読めるようになります。
📊 連載「統計のきほん」(全4回)
回帰分析やデータ分析の“土台”になる統計の基礎を、数式をできるだけ使わずに、図でやさしく整理する連載です。

『一緒に動く』のと『原因→結果』はぜんぜん別もの。ここを混同すると、データにだまされちゃうよ。

相関とは?|2つの量が“一緒に動く”度合い
相関とは、片方が変わると、もう片方も変わるという、2つの量の関係のことです。大きく3つのパターンがあります。
- 正の相関——片方が増えると、もう片方も増える(例:気温とアイスの売上)
- 負の相関——片方が増えると、もう片方は減る(例:気温と暖房の使用量)
- 無相関——2つの間に、はっきりした関係が見えない
図のように、2つの量を縦軸・横軸にとって点を打った散布図を見ると、相関のようすが一目で分かります。点が右肩上がりに並べば正の相関、右肩下がりなら負の相関、ばらばらなら無相関です。
相関係数|関係の強さを-1〜+1で表す
相関の強さを1つの数字にまとめたのが、相関係数(r)です。-1から+1までの値をとり、こう読みます。
- +1に近い——強い正の相関(きれいに右肩上がり)
- -1に近い——強い負の相関(きれいに右肩下がり)
- 0に近い——相関が弱い・ほとんどない
目安として、|r|が0.7以上なら「強い相関」、0.4〜0.7で「中くらい」、0.2以下で「ほとんどない」と語られることが多いです(分野によって基準は変わります)。Excelなら =CORREL(範囲1, 範囲2) で一発で計算できます。ただし、この“目安”はあくまで参考。同じr=0.5でも、扱うテーマによって「十分強い」とも「弱い」とも解釈が変わります。数字だけを覚えるのではなく、次に説明する“散布図で確かめる”という習慣とセットにするのが、相関と上手につき合うコツです。
相関係数 r は -1〜+1。+1に近いほど強い正の相関、-1に近いほど強い負の相関、0に近いほど無相関。
【最重要】相関 ≠ 因果
ここが、この記事でいちばん伝えたいところです。「相関がある」ことは、「片方が原因で、もう片方が結果」を意味しません。 これを混同すると、データに簡単にだまされます。
有名な例があります。「アイスの売上が増えると、水の事故が増える」——たしかに相関します。でも、アイスが事故を引き起こすわけではありませんよね。裏に“気温”という第3の要因があり、暑いと「アイスも売れる」「水遊びも増えて事故も増える」だけなのです。
このように、相関が見える理由は3つ考えられます。
- 本当に因果がある——AがBの原因(例:勉強時間→点数)
- 第3の要因(交絡)——別の何かが、両方を動かしている(アイスの例)
- まったくの偶然——たまたま数字が似た動きをしただけ(見せかけの相関)
だから、相関を見つけたら「本当に原因と結果なのか? 裏に別の要因はないか?」と一度立ち止まる。これが、データを正しく読む人の習慣です。
相関と回帰の違い
相関とよく一緒に出てくるのが回帰です。似ていますが、役割が違います。
- 相関——2つの量の関係の“強さと向き”を、1つの数字(r)で表す。どちらが原因かは問わない
- 回帰——「Xからyを予測する」式を作る。予測や、要因の影響度を知るのに使う
ざっくり、**「関係があるか・どれくらい強いかを見るのが相関」「その関係を使って予測するのが回帰」**。なお、回帰の精度を表す決定係数R²は、単回帰では相関係数を二乗した値に一致します。両者は地続きなのです。
相関を見るときの注意点
相関係数は便利ですが、クセもあります。鵜呑みにしないために、知っておきましょう。
- 外れ値に弱い——極端な点が1つあるだけで、相関係数が大きく変わることがある
- 直線的な関係しか測れない——きれいなU字のような関係でも、相関係数はほぼ0になることがある
- 必ず散布図も見る——数字(r)だけでなく、点の散らばりを目で確認するのが鉄則
「相関係数が0.1だから関係なし」と決めつけて散布図を見たら、実はきれいな曲線の関係が隠れていた——そんなことは、実際によくあります。
具体例で考える|気温とアイス
身近な例で、相関のイメージを固めましょう。「1日の最高気温」と「アイスの売上」のデータを、毎日ぶん集めて散布図にします。
すると、点はきれいに右肩上がりに並ぶはずです。気温が高い日ほどアイスが売れる——強い正の相関(rは+0.9くらい)です。この場合は「暑い→アイスが欲しくなる」という、納得できる因果もありそうです。でも次の例は、そう単純ではありません。
有名な「見せかけの相関」
世の中には、相関するのに因果がない、面白い(そして危うい)例がたくさんあります。
- アイスの売上 と 水の事故——どちらも「気温」で動くだけ。アイスは事故の原因ではない
- 消防車の出動台数 と 火事の被害額——大きな火事ほど両方が増えるだけ。消防車が被害を増やすわけではない
- 子どもの足の大きさ と 漢字の読める数——どちらも「年齢」で増えるだけ
どれも、笑い話のようでいて、データ分析では本当に起こる罠です。「裏に共通の原因(この場合は気温・規模・年齢)がいないか?」——相関を見たら、この問いを必ず立てる。それが“見せかけ”に引っかからないコツです。世の中の「○○する人は△△らしい」という話の多くは、実は第3の要因による見せかけの相関だったりします。ニュースや広告のデータを鵜呑みにしないためにも、この感覚はとても役立ちます。
外れ値や“曲がった関係”に強い相関
ふつうの相関係数(ピアソンの相関係数)は、外れ値や曲がった関係に弱いという弱点がありました。これを補う仲間も知っておくと役立ちます。
代表が順位相関(スピアマンの相関係数)です。これは、値そのものではなく「順位」に注目して相関を測ります。順位で見るので、極端な外れ値の影響を受けにくく、「片方が増えれば片方も増える(が、直線とは限らない)」という関係もうまく捉えられます。データに外れ値が多いときや、順位だけが意味を持つときに重宝します。
相関は“発見の入り口”
ここまで「相関≠因果」と注意ばかりしてきましたが、相関が役に立たないわけでは決してありません。むしろ逆で、相関はデータ分析の“発見の入り口”です。
たくさんの項目の中から「お、この2つは強く相関しているぞ」と見つけることが、仮説づくりの第一歩になります。「相関がある→なぜだろう?→本当に因果か検証しよう」という流れで、相関は調査の出発点として大活躍するのです。大切なのは、相関を見つけて満足せず、その先の「なぜ」を追いかける姿勢。相関は“答え”ではなく“問いの始まり”だと考えると、ちょうどよい距離感で使えます。
ビジネスでの使いどころ
相関は、実務のいろいろな場面で活躍します。
- マーケティング——広告費と売上、来店頻度と購入額などの関係を探る
- 品質・改善——「どの工程の数値が、不良率と関係しているか」を見つける
- 特徴量の選定——機械学習で、目的とよく相関する項目を手がかりに選ぶ
ただし最後はやはり「相関≠因果」。そして、説明変数どうしが強く相関していると多重共線性という別の問題も起きます。相関は強力な道具だからこそ、クセを知って使いこなしたいですね。
まとめ
相関とは、2つの量が一緒に動く度合いのことで、相関係数(r)は-1〜+1でその強さと向きを表します。散布図を描けば、正・負・無相関のようすが一目で分かり、相関係数という1つの数字で、その強さを手早く比べられます。
そして何より大切なのが、「相関≠因果」。相関があっても、原因と結果とは限りません。第3の要因や偶然が隠れていないか、いつも一歩立ち止まって考える——これが、データにだまされないための心がまえです。次回は連載最終回、その差が“偶然か意味があるか”を見極める仮説検定に進みます。
「相関」は、データ分析でもっとも便利で、もっとも誤用されやすい概念です。だからこそ、正しく使えると差がつきます。散布図で関係を“見て”、相関係数で強さを“測り”、そして『これは本当に因果か?』と一歩“疑う”。この3拍子を身につければ、ニュースや広告で見かける「○○すると××になる!」というデータにも、冷静に向き合えるようになります。相関を制する者は、データ分析の入り口を制す——そう言ってもいいくらい、大切なテーマでした。次回の仮説検定とあわせて、「データに惑わされない目」を育てていきましょう。
相関=2つの量が一緒に動く度合い。相関係数 r は -1〜+1。
【最重要】相関≠因果。第3の要因や偶然に注意。
数字だけでなく散布図も必ず見る。外れ値・非線形に弱い。
よくある質問(FAQ)
相関とは何ですか?
A. 片方が変わるともう片方も変わる、という2つの量の関係のことです。片方が増えると一方も増えるのが正の相関、減るのが負の相関、はっきりした関係がないのが無相関です。散布図を描くと一目で分かります。
相関係数(r)とは何ですか?
A. 相関の強さと向きを-1から+1までの1つの数字で表したものです。+1に近いほど強い正の相関、-1に近いほど強い負の相関、0に近いほど相関が弱いことを意味します。ExcelのCORREL関数で計算できます。
「相関≠因果」とはどういう意味ですか?
A. 相関がある(一緒に動く)ことは、片方が原因でもう片方が結果だ、ということを意味しない、という重要な注意です。たとえばアイスの売上と水の事故は相関しますが、裏にある『気温』が両方を動かしているだけです。
見せかけの相関とは何ですか?
A. 本当は因果関係がないのに、たまたま数字が似た動きをして相関しているように見えるものです。第3の要因(交絡)が両方を動かしている場合や、まったくの偶然の場合があります。相関を見たら裏の要因を疑うことが大切です。
相関と回帰の違いは何ですか?
A. 相関は2つの量の関係の強さと向きを1つの数字で表すもので、どちらが原因かは問いません。回帰はXからyを予測する式を作るもので、予測や要因の影響度を知るのに使います。関係を見るのが相関、使って予測するのが回帰です。
相関係数を見るときの注意点は?
A. 外れ値が1つあるだけで値が大きく変わること、U字のような曲がった関係は相関係数がほぼ0になり捉えられないことです。数字だけで判断せず、必ず散布図を描いて点の散らばりを目で確認することが鉄則です。
相関係数はいくつ以上で「相関あり」と言えますか?
A. 分野によりますが、目安として絶対値が0.7以上で強い相関、0.4〜0.7で中くらい、0.2以下でほとんどないと語られることが多いです。ただし数字だけでなく、散布図や背景の意味とあわせて判断します。
あわせて読みたい
参考・一次ソース
- 総務省統計局「なるほど統計学園」(stat.go.jp)
- IBM「What is correlation?」(ibm.com)
※本記事は2026年6月時点の一般的な統計の考え方を初心者向けに整理したものです。厳密な定義や検定の前提条件は専門書もご確認ください。
🧪 “カテゴリ同士”の関係を検定するには:相関係数は数値どうしの関係でしたが、性別×好みのようなカテゴリ同士に関係があるかは、カイ二乗検定で調べます。

