AIの最新情報・実演を動画でチェック

*当ブログではアフィリエイト広告を利用しています。

データ分析・機械学習

Excelでできる!重回帰分析の使い方【2026年最新版・初心者向け】

Excelで重回帰分析|複数の説明変数X1・X2・X3から目的変数Yを予測する分析画面のイメージ
ルミィ

🎯 はじめに

この記事は「機械学習入門」シリーズの1本です。AIの全体像から知りたい方はAIの地図|目的別にAIツールを探す、分析手法を順番に学びたい方はデータ分析・機械学習カテゴリもあわせてご覧ください。

📖 まずは線形回帰の基礎から学びたい方は 線形回帰分析とは?やり方から活用法まで徹底解説 をご覧ください。

📅 最終更新:2026年4月26日(新規公開)
✅ Excel 2024 / Microsoft 365で動作確認済み
✅ プログラミング不要・初心者でも30分で完了
✅ 線形回帰の発展形として実例ベースで解説
✅ 多重共線性などのトラブル対処法も収録
✅ FAQ・よくある質問を充実

重回帰分析は「複数の要因を同時に分析できる」単回帰の発展形。Excelの「分析ツール」を使えば、入力X範囲に複数列を指定するだけで実行できます。

「重回帰分析って単回帰と何が違うの?」「Excelでもできるの?」

そう思った人、安心してください。重回帰分析は、線形回帰の発展形で、複数の要因を同時に分析できる強力な手法です。実はExcelの「分析ツール」を使えば、プログラミング知識ゼロでも本格的な重回帰分析が実行できます。私自身も最初に「住宅価格を面積・部屋数・築年数で予測したい」と思ったとき、Excelで試したことが重回帰分析の入口になりました。

ルミィ
ルミィ

この記事では「重回帰分析って何?」「Excelでどうやるの?」「結果はどう読むの?」を、初心者向けに一歩ずつ解説していくよ。読み終わるころには、自分のデータで分析できるようになっているはず!

🙋 この記事はこんな人に向いています

  • 単回帰分析は知っているが、重回帰分析が何かわからない人
  • プログラミングなしで複数変数の回帰分析を試したい人
  • Excelの回帰分析の結果(係数表・P値・補正R²)の読み方を知りたい人
  • 多重共線性・過学習という言葉を聞いたことがあるが意味が曖昧な人
  • 住宅価格・売上・採用分析など、業務で重回帰を使ってみたい人

📊 重回帰分析って何?【基礎編】

単回帰分析との違い

まずは単回帰と重回帰の違いをざっくり押さえよう。

  • 単回帰分析:説明変数が1つ(例:面積だけで価格を予測)
  • 重回帰分析:説明変数が複数(例:面積・部屋数・築年数で価格を予測)

現実のビジネスでは、結果に影響する要因は1つだけじゃないよね。だから「複数の要因を同時に扱える」重回帰分析の方が実用的な場面が多いんだ。

ルミィ
ルミィ

例えば住宅価格って、面積だけじゃなく、部屋数・築年数・駅からの距離・階数…色んな要因で決まるよね。重回帰分析なら、これら全部を同時に考慮した予測式が作れるんだ。

重回帰分析の数式(怖くないよ)

重回帰分析の式は、こんな形をしているよ。

Y = a₁X₁ + a₂X₂ + a₃X₃ + ... + b
(Y:予測したい値、X:説明変数、a:係数、b:切片)

式は複雑そうに見えるけど、要するに「各変数に重み(係数)を掛けて足し算してるだけ」。中学校で習った一次関数の延長だよ。

ルミィ
ルミィ

数式は覚えなくても全然OK!大事なのは「どの変数がどのくらい影響しているか」を読み取る力なんだ。計算はExcelがやってくれるからね。

重回帰分析でわかること

  • 各変数の影響度:どの要因が結果に強く影響しているか
  • 影響の方向:プラス影響かマイナス影響か
  • 予測式:新しいデータが来たときの予測値
  • モデルの精度:この予測式がどれくらい当たるか

💻 Excelで重回帰分析をやってみよう【実践編】

ルミィ
ルミィ

ここからは実際にExcelで重回帰分析を動かしてみるよ。手順は線形回帰(単回帰)とほぼ同じだから、すでにやったことある人は流れがつかみやすいはず!

ステップ1:分析ツールを有効にする

Excelの「分析ツール」は初期状態では無効になっているよ。以下の手順で有効化しよう。

  • 「ファイル」→「オプション」をクリック
  • 左メニューの「アドイン」を選択
  • 下部の「管理」を「Excelアドイン」にして「設定」をクリック
  • 「分析ツール」にチェックを入れて「OK」

「データ」タブに「データ分析」ボタンが追加されていれば設定完了だよ。

ステップ2:データを準備する

重回帰分析では、目的変数(予測したい値)と説明変数(要因)を以下の形に整理するよ。

例:住宅価格の予測

| 面積 | 部屋数 | 築年数 | 駅距離 | 階数 | 価格 |
|------|--------|--------|--------|------|------|
|  85  |   3    |   10   |   5    |   3  | 2500 |
|  60  |   2    |   25   |  15    |   1  | 1500 |
|  …   |   …    |    …   |   …    |   …  |  …   |

左側に説明変数(X)、右側に目的変数(Y)を置くのが基本。1行目はラベル(項目名)にしておこう。

ルミィ
ルミィ

データの準備さえできれば、分析自体は数クリックで完了。だからこそ、データの質が結果の質を左右するんだ。「ゴミデータからは、ゴミの結果しか出ない」って分析の世界ではよく言われるよ。

ステップ3:回帰分析を実行する

  • 「データ」タブ →「データ分析」をクリック
  • 「回帰分析」を選択 →「OK」
  • 入力Y範囲:目的変数(価格)の列を指定
  • 入力X範囲:説明変数(面積〜階数)すべての列を指定 ← ここがポイント!
  • 「ラベル」にチェック(1行目を項目名として認識)
  • 出力先を選んで「OK」

単回帰との違いは「入力X範囲に複数列を指定する」だけ。これで重回帰分析になるんだ。

📋 結果の読み方【ここが本番】

Excelの重回帰分析の結果は、大きく3つのブロックに分かれているよ。それぞれ何を見るかを押さえよう。

① 回帰統計(モデル全体の精度)

  • 重相関R:実測値と予測値の相関。1に近いほど当てはまりは良いが、良好といえる水準は分野や目的によって異なる
  • 重決定R²:このモデルがデータのばらつきをどれくらい説明できているか(ざっくりした目安であり、良い数値の基準は分野によって異なる)
  • 補正R²:変数の数を考慮した決定係数(重回帰ではこちらを重視)
  • 標準誤差:平均的な予測誤差
ルミィ
ルミィ

重回帰では、変数を増やすほどR²が機械的に上がっちゃう性質があるから、補正R²の方を見るのがコツだよ。R²と補正R²がほぼ同じなら、変数の数は適切ってこと。

② 分散分析表(ANOVA)

「有意F」は、モデル全体が統計的に意味を持つかを見る指標です。一般に0.05未満なら「説明変数全体として目的変数と関係がある可能性が高い」と判断します。ただし、有意だからといって予測精度が高いとは限らないため、R²・補正R²・残差もあわせて確認しましょう。

③ 係数表(一番重要!)

各説明変数が結果にどれくらい影響しているかが書かれているよ。

  • 係数:その変数が1単位増えたときの影響量(プラスなら上昇、マイナスなら下落)
  • P値:その変数の影響が「統計的に意味がある」か(0.05未満で有意)
  • 標準誤差:係数の推定値のばらつき。小さいほど、その係数の推定が安定していると考えやすい
  • 95%信頼区間:係数の真の値が含まれる範囲
ルミィ
ルミィ

P値が0.05以上の変数は「このデータでは影響がはっきり確認できない」可能性があります。ただし、業務上・理論上重要な変数まで機械的に削るのは危険です。P値、係数の意味、ドメイン知識を合わせて判断しましょう。

⚠️ 重回帰分析で気をつけたい3つの落とし穴

落とし穴1:多重共線性

説明変数同士に強い相関があると、係数が不安定になって結果が信頼できなくなるよ。これを「多重共線性」って呼ぶんだ。

  • 例:「面積」と「部屋数」は通常強く相関する → 両方入れると係数がおかしくなる
  • 対策:相関係数が高い変数ペアは、意味が重複していないか確認し、必要に応じて片方を外す・統合する
  • チェック方法:VIFが5〜10を超える変数は多重共線性の可能性があるため対処を検討する

▶ 多重共線性の詳しい解説は多重共線性とは?VIFの見方・原因・対処法を初心者向けに解説でも扱っているよ。

落とし穴2:過学習

変数を入れすぎると、訓練データには完璧に当てはまるけど、新しいデータに弱いモデルができちゃう。これが「過学習」だよ。

  • 対策の目安:初心者はまず「説明変数1つあたり10〜20件以上」のデータを目安に(例:5変数なら50〜100行以上)
  • 見分け方:R²と補正R²の差が大きいと過学習の疑い
  • シンプル is best:意味のある変数だけ残そう

落とし穴3:因果関係と相関関係の混同

重回帰で「強い影響」が見つかっても、それが必ずしも因果関係を示すわけじゃないよ。

  • 例:「アイスの売上」と「水難事故件数」は強く相関する → でも因果関係はない(共通原因は気温)
  • 回帰分析が示すのはあくまで「相関」と「予測」だけ
  • 因果関係を主張したいなら、追加の検証(実験・先行研究)が必要

🌍 重回帰分析の活用シーン

実際のビジネスや研究では、こんな場面で重回帰分析が活躍しているよ。

不動産・住宅業界

  • 物件価格の査定(面積・築年数・駅距離・階数などから)
  • 賃料の妥当性チェック
  • 投資物件のリターン予測

マーケティング

  • 広告費・販促費の効果測定
  • 商品売上の要因分析
  • 顧客LTVの予測

人事・採用

  • 社員の業績要因分析
  • 離職率に影響する要因の特定
  • 採用基準の最適化

医療・健康

  • 生活習慣と健康指標の関係分析
  • 治療効果の要因評価
  • 疾患リスクの予測
⚠️ 高リスク領域での利用について

医療・採用・与信など人に直接影響する領域で分析結果を活用する場合は、モデルの精度だけでなく、公平性・説明責任・専門家による確認が重要になります。この記事では、あくまで重回帰分析の考え方を理解するための例として扱います。

❓ よくある質問(FAQ)

Q1. 重回帰分析と単回帰分析、どちらを使えばいい?

結果に影響する要因が複数あると分かっている場合は重回帰、要因が1つに特定できる場合は単回帰がおすすめだよ。実務では複数要因が絡むケースが多いから、重回帰の方がよく使われるんだ。

Q2. 説明変数の数はいくつが適切?

明確な正解はありませんが、初心者はまず「説明変数1つあたり10〜20件以上」のデータを目安にすると安全です。例えば100行のデータなら、最初は5〜10変数程度から始めると解釈しやすくなります。関連性の薄い変数をむやみに入れず、ドメイン知識で「効きそうな変数」を厳選しましょう。

Q3. 質的変数(カテゴリ変数)も使える?

使えるよ!ただし「ダミー変数」に変換する必要があるんだ。例えば「天気(晴れ・雨・曇り)」なら、「晴れフラグ(0/1)」「雨フラグ(0/1)」のように、カテゴリ数 −1 個の0/1変数に分解して扱うよ。

Q4. 重回帰の結果が「直感に反する」のは何がおかしい?

多重共線性が原因のことが多いよ。例えば「面積」と「部屋数」を両方入れると、係数が不安定になって、本来プラスの影響であるべき変数がマイナスの係数になることがあるんだ。相関の強い変数は片方だけ残そう。

Q5. P値が高い変数は必ず除外すべき?

原則として、P値が0.05以上の変数は「影響がはっきりしない」と判断して除外を検討してOK。ただし、ドメイン知識から「絶対に重要」と分かっている変数は、P値が高くても残す判断もありだよ。

Q6. PythonやRと比べてExcelで重回帰をやるメリットは?

プログラミング不要で、結果がすぐ画面で確認できる手軽さがメリット。データが数千行までなら、Excelで十分対応できるよ。本格的な分析や自動化が必要になったら、Python/Rに移行するのがおすすめだよ。

🎉 まとめ

Excelの「分析ツール」を使えば、プログラミング不要で本格的な重回帰分析ができるよ。

今回のポイント:

  • 重回帰分析は「複数要因の同時分析」ができる強力な手法
  • Excelの「データ分析」→「回帰分析」で実行できる
  • 係数の符号・P値・補正R²をしっかり読むことが重要
  • 多重共線性・過学習・因果関係の混同に注意

今すぐ試せる次の一歩:
1. 自分の業務データで重回帰分析を実行し、係数表とP値を確認する
2. R²と補正R²の差が大きければ、P値の高い変数を1つ除外してみる
3. VIFを確認して、多重共線性が疑われる変数があれば片方を除外する

ルミィ
ルミィ

ここまで読んでくれてありがとう!重回帰分析って実はそんなに難しくなかったんじゃないかな?「もっと色んな分析手法も試してみたい」って思った人には、下の本がぴったりだよ。Pythonに進む前のステップとしてもおすすめなんだ。

🚀 次のステップに進みたい人へ
Excelで体験できる機械学習の定番書。重回帰の先にある手法まで一気通貫で学べるから、独学の次の1冊にどうぞ。

📍 もっとAIを知りたい方へ

迷ったら、まずは AIの地図 から。目的別にぴったりのAIが見つかります。

同じ「データ分析・機械学習」カテゴリの関連記事

次に読むおすすめ記事

ルミィ
ルミィ
AIナビゲーター
ChatGPT・Gemini・Claudeなどの会話AI、画像生成AI、動画生成AI、資料作成AI、AI検索ツールを初心者向けに解説するAIナビゲーター。実際に使ってみた感想や、仕事・学習・発信に役立つAI活用法をわかりやすく紹介しています。
記事URLをコピーしました