次の DEMO を見にいく

*当ブログではアフェリエイト広告を利用しています。

Excelでできる!重回帰分析の使い方【2026年最新版・初心者向け】

Excelで重回帰分析|複数の説明変数X1・X2・X3から目的変数Yを予測する分析画面のイメージ
momeq

🎯 はじめに

📅 最終更新:2026年4月26日(新規公開)
✅ Excel 2024 / Microsoft 365で動作確認済み
✅ プログラミング不要・初心者でも30分で完了
✅ 線形回帰の発展形として実例ベースで解説
✅ 多重共線性などのトラブル対処法も収録
✅ FAQ・よくある質問を充実

「重回帰分析って単回帰と何が違うの?」「Excelでもできるの?」

そう思った人、安心してね。重回帰分析は、線形回帰の発展形で、複数の要因を同時に分析できる強力な手法だよ。実はExcelの「分析ツール」を使えば、プログラミング知識ゼロでも本格的な重回帰分析が実行できるんだ。

ルミィ
ルミィ
ルミィ
ルミィ

この記事では「重回帰分析って何?」「Excelでどうやるの?」「結果はどう読むの?」を、初心者向けに一歩ずつ解説していくよ。読み終わるころには、自分のデータで分析できるようになっているはず!

📊 重回帰分析って何?【基礎編】

単回帰分析との違い

まずは単回帰と重回帰の違いをざっくり押さえよう。

  • 単回帰分析:説明変数が1つ(例:面積だけで価格を予測)
  • 重回帰分析:説明変数が複数(例:面積・部屋数・築年数で価格を予測)

現実のビジネスでは、結果に影響する要因は1つだけじゃないよね。だから「複数の要因を同時に扱える」重回帰分析の方が実用的な場面が多いんだ。

ルミィ
ルミィ
ルミィ
ルミィ

例えば住宅価格って、面積だけじゃなく、部屋数・築年数・駅からの距離・階数…色んな要因で決まるよね。重回帰分析なら、これら全部を同時に考慮した予測式が作れるんだ。

重回帰分析の数式(怖くないよ)

重回帰分析の式は、こんな形をしているよ。

Y = a₁X₁ + a₂X₂ + a₃X₃ + ... + b
(Y:予測したい値、X:説明変数、a:係数、b:切片)

式は複雑そうに見えるけど、要するに「各変数に重み(係数)を掛けて足し算してるだけ」。中学校で習った一次関数の延長だよ。

ルミィ
ルミィ
ルミィ
ルミィ

数式は覚えなくても全然OK!大事なのは「どの変数がどのくらい影響しているか」を読み取る力なんだ。計算はExcelがやってくれるからね。

重回帰分析でわかること

  • 各変数の影響度:どの要因が結果に強く影響しているか
  • 影響の方向:プラス影響かマイナス影響か
  • 予測式:新しいデータが来たときの予測値
  • モデルの精度:この予測式がどれくらい当たるか

💻 Excelで重回帰分析をやってみよう【実践編】

ルミィ
ルミィ
ルミィ
ルミィ

ここからは実際にExcelで重回帰分析を動かしてみるよ。手順は線形回帰(単回帰)とほぼ同じだから、すでにやったことある人は流れがつかみやすいはず!

ステップ1:分析ツールを有効にする

Excelの「分析ツール」は初期状態では無効になっているよ。以下の手順で有効化しよう。

  • 「ファイル」→「オプション」をクリック
  • 左メニューの「アドイン」を選択
  • 下部の「管理」を「Excelアドイン」にして「設定」をクリック
  • 「分析ツール」にチェックを入れて「OK」

「データ」タブに「データ分析」ボタンが追加されていれば設定完了だよ。

ステップ2:データを準備する

重回帰分析では、目的変数(予測したい値)と説明変数(要因)を以下の形に整理するよ。

例:住宅価格の予測

| 面積 | 部屋数 | 築年数 | 駅距離 | 階数 | 価格 |
|------|--------|--------|--------|------|------|
|  85  |   3    |   10   |   5    |   3  | 2500 |
|  60  |   2    |   25   |  15    |   1  | 1500 |
|  …   |   …    |    …   |   …    |   …  |  …   |

左側に説明変数(X)、右側に目的変数(Y)を置くのが基本。1行目はラベル(項目名)にしておこう。

ルミィ
ルミィ
ルミィ
ルミィ

データの準備さえできれば、分析自体は数クリックで完了。だからこそ、データの質が結果の質を左右するんだ。「ゴミデータからは、ゴミの結果しか出ない」って分析の世界ではよく言われるよ。

ステップ3:回帰分析を実行する

  • 「データ」タブ →「データ分析」をクリック
  • 「回帰分析」を選択 →「OK」
  • 入力Y範囲:目的変数(価格)の列を指定
  • 入力X範囲:説明変数(面積〜階数)すべての列を指定 ← ここがポイント!
  • 「ラベル」にチェック(1行目を項目名として認識)
  • 出力先を選んで「OK」

単回帰との違いは「入力X範囲に複数列を指定する」だけ。これで重回帰分析になるんだ。

ルミィ
ルミィ
ルミィ
ルミィ

ここまでできたら、もう自分で分析できる準備は整ったよ!「線形回帰の次はどんな手法があるんだろう?」って気になった人には、下の本がぴったり。Excelで体験できる機械学習の入門書として定番の1冊だよ。

📚 独学の幅を広げたい人へ
線形回帰・重回帰の先にある分析手法(決定木・クラスタリング・ニューラルネット入門など)を、Excel画面付きで体験できる入門書だよ。

📋 結果の読み方【ここが本番】

Excelの重回帰分析の結果は、大きく3つのブロックに分かれているよ。それぞれ何を見るかを押さえよう。

① 回帰統計(モデル全体の精度)

  • 重相関R:実測値と予測値の相関(0.8以上で良好)
  • 重決定R²:このモデルが結果の何%を説明できるか(0.7以上で実用的)
  • 補正R²:変数の数を考慮した決定係数(重回帰ではこちらを重視)
  • 標準誤差:平均的な予測誤差
ルミィ
ルミィ
ルミィ
ルミィ

重回帰では、変数を増やすほどR²が機械的に上がっちゃう性質があるから、補正R²の方を見るのがコツだよ。R²と補正R²がほぼ同じなら、変数の数は適切ってこと。

② 分散分析表(ANOVA)

「有意F」または「P値」が0.05未満なら、モデル全体が統計的に意味があるって判断できるよ。0.001以下ならかなり信頼できるレベル。

③ 係数表(一番重要!)

各説明変数が結果にどれくらい影響しているかが書かれているよ。

  • 係数:その変数が1単位増えたときの影響量(プラスなら上昇、マイナスなら下落)
  • P値:その変数の影響が「統計的に意味がある」か(0.05未満で有意)
  • 標準誤差:係数の信頼度(小さいほど信頼できる)
  • 95%信頼区間:係数の真の値が含まれる範囲
ルミィ
ルミィ
ルミィ
ルミィ

P値が0.05以上の変数は「結果への影響がはっきりしない」可能性が高いから、思い切って除外することも検討してね。シンプルなモデルの方が解釈しやすいし、新しいデータでも安定して機能するんだ。

⚠️ 重回帰分析で気をつけたい3つの落とし穴

落とし穴1:多重共線性

説明変数同士に強い相関があると、係数が不安定になって結果が信頼できなくなるよ。これを「多重共線性」って呼ぶんだ。

  • 例:「面積」と「部屋数」は通常強く相関する → 両方入れると係数がおかしくなる
  • 対策:相関係数が0.7以上のペアは、片方だけ採用する
  • チェック方法:VIF(分散拡大係数)が10以上の変数は除外を検討

落とし穴2:過学習

変数を入れすぎると、訓練データには完璧に当てはまるけど、新しいデータに弱いモデルができちゃう。これが「過学習」だよ。

  • 対策:サンプル数÷5を最大変数数の目安に(例:100行なら最大20変数)
  • 見分け方:R²と補正R²の差が大きいと過学習の疑い
  • シンプル is best:意味のある変数だけ残そう

落とし穴3:因果関係と相関関係の混同

重回帰で「強い影響」が見つかっても、それが必ずしも因果関係を示すわけじゃないよ。

  • 例:「アイスの売上」と「水難事故件数」は強く相関する → でも因果関係はない(共通原因は気温)
  • 回帰分析が示すのはあくまで「相関」と「予測」だけ
  • 因果関係を主張したいなら、追加の検証(実験・先行研究)が必要
ルミィ
ルミィ
ルミィ
ルミィ

落とし穴を知っておくと、データ分析のレベルが一段上がるよ!「もっと体系的に学びたい」って思った人には、下の本がおすすめ。Excelをそのまま使ってビジネス現場の機械学習を一気通貫で学べる、定番の1冊なんだ。

💼 ビジネス現場で活用したい人へ
重回帰の発展形(決定木・分類)まで、Excelで体験できる定番書。実務に応用しやすい内容になっているよ。

🌍 重回帰分析の活用シーン

実際のビジネスや研究では、こんな場面で重回帰分析が活躍しているよ。

不動産・住宅業界

  • 物件価格の査定(面積・築年数・駅距離・階数などから)
  • 賃料の妥当性チェック
  • 投資物件のリターン予測

マーケティング

  • 広告費・販促費の効果測定
  • 商品売上の要因分析
  • 顧客LTVの予測

人事・採用

  • 社員の業績要因分析
  • 離職率に影響する要因の特定
  • 採用基準の最適化

医療・健康

  • 生活習慣と健康指標の関係分析
  • 治療効果の要因評価
  • 疾患リスクの予測

❓ よくある質問(FAQ)

Q1. 重回帰分析と単回帰分析、どちらを使えばいい?

結果に影響する要因が複数あると分かっている場合は重回帰、要因が1つに特定できる場合は単回帰がおすすめだよ。実務では複数要因が絡むケースが多いから、重回帰の方がよく使われるんだ。

Q2. 説明変数の数はいくつが適切?

「サンプル数 ÷ 5」を最大変数数の目安にしよう。例えばデータが100行なら最大20変数まで。ただし、関連性の薄い変数は入れず、ドメイン知識で「効きそうな変数」を厳選するのがコツだよ。

Q3. 質的変数(カテゴリ変数)も使える?

使えるよ!ただし「ダミー変数」に変換する必要があるんだ。例えば「天気(晴れ・雨・曇り)」なら、「晴れフラグ(0/1)」「雨フラグ(0/1)」のように、カテゴリ数 −1 個の0/1変数に分解して扱うよ。

Q4. 重回帰の結果が「直感に反する」のは何がおかしい?

多重共線性が原因のことが多いよ。例えば「面積」と「部屋数」を両方入れると、係数が不安定になって、本来プラスの影響であるべき変数がマイナスの係数になることがあるんだ。相関の強い変数は片方だけ残そう。

Q5. P値が高い変数は必ず除外すべき?

原則として、P値が0.05以上の変数は「影響がはっきりしない」と判断して除外を検討してOK。ただし、ドメイン知識から「絶対に重要」と分かっている変数は、P値が高くても残す判断もありだよ。

Q6. PythonやRと比べてExcelで重回帰をやるメリットは?

プログラミング不要で、結果がすぐ画面で確認できる手軽さがメリット。データが数千行までなら、Excelで十分対応できるよ。本格的な分析や自動化が必要になったら、Python/Rに移行するのがおすすめだよ。

🎉 まとめ

Excelの「分析ツール」を使えば、プログラミング不要で本格的な重回帰分析ができるよ。

今回のポイント:

  • 重回帰分析は「複数要因の同時分析」ができる強力な手法
  • Excelの「データ分析」→「回帰分析」で実行できる
  • 係数の符号・P値・補正R²をしっかり読むことが重要
  • 多重共線性・過学習・因果関係の混同に注意

次のステップ:

  • 自分の業務データで重回帰分析を試してみる
  • 結果の解釈に慣れたら、Pythonでの実装にも挑戦
  • より複雑な手法(決定木・ランダムフォレスト)への発展を視野に
ルミィ
ルミィ
ルミィ
ルミィ

ここまで読んでくれてありがとう!重回帰分析って実はそんなに難しくなかったんじゃないかな?「もっと色んな分析手法も試してみたい」って思った人には、下の本がぴったりだよ。Pythonに進む前のステップとしてもおすすめなんだ。

🚀 次のステップに進みたい人へ
Excelで体験できる機械学習の定番書。重回帰の先にある手法まで一気通貫で学べるから、独学の次の1冊にどうぞ。

📍 もっとAIを知りたい方へ

迷ったら、まずは AIの地図 から。目的別にぴったりのAIが見つかります。

同じ「データ分析・機械学習」カテゴリの関連記事

ルミィ
ルミィ
AIナビゲーター
ChatGPTにハマってから毎日AIを触り続けるブログ運営者。最新AIツールを初心者目線で発信しています。YouTubeでも解説動画を投稿中!
記事URLをコピーしました