次の DEMO を見にいく

*当ブログではアフェリエイト広告を利用しています。

決定係数R²とは?線形回帰の精度の見方を徹底解説【2026年最新版・初心者向け】

決定係数R²とは|回帰直線の当てはまりの良さをメーターと散布図で可視化したイメージ
momeq

🎯 はじめに

📅 最終更新:2026年4月26日(新規公開)
✅ 数式が苦手な人でもわかる図解中心の解説
✅ 分野別の「良いR²の目安」一覧表付き
✅ 補正R²との違いも完全カバー
✅ よくある誤解・落とし穴も収録
✅ FAQで疑問を一気に解消

「決定係数R²ってよく聞くけど、結局何を表してるの?」「いくつあれば良いの?」

回帰分析を学んでいると必ず出会う「決定係数R²」。実はこの数値、線形回帰モデルの“信頼度”を判断する一番の指標なんだ。でも分野によって「良い基準」が違ったり、補正R²との使い分けが難しかったりして、初心者がつまずきやすいポイントでもあるよ。

ルミィ
ルミィ

この記事では、決定係数R²の意味から見方、分野別の目安、補正R²との違い、よくある誤解まで一気に解説していくよ。読み終わるころには、回帰分析の結果を自信を持って解釈できるようになっているはず!

📊 決定係数R²って何?

一言でいうと「モデルの説明力」

決定係数R²は、回帰モデルが目的変数のばらつきをどれくらい説明できているかを示す指標だよ。

  • 範囲:0 〜 1(一部の場合はマイナスも)
  • 1に近いほど:モデルの説明力が高い(予測がよく当たる)
  • 0に近いほど:モデルの説明力が低い(予測が当たらない)
ルミィ
ルミィ

R²=0.75 だったら、「このモデルはデータのばらつきの75%を説明できている」って意味だよ。残りの25%は、モデルに含まれていない他の要因で動いている部分、と考えるとイメージしやすいかも。

数式(怖くないよ)

数式で書くとこんな感じだけど、覚える必要はないよ。

R² = 1 - (残差の二乗和) / (全変動の二乗和)
    = 1 - SSres / SStot

意味:
- SSres:モデルで説明できなかったばらつき
- SStot:データ全体のばらつき
- R²:説明できたばらつきの割合

要するに「全体のばらつきのうち、モデルで説明できた部分の割合」ってこと。直感的にわかりやすいよね。

📏 分野別「良いR²」の目安

「R²はいくつあれば良いの?」という質問の答えは、分野によって全然違うんだ。

分野良好な範囲理由
物理・工学0.9 以上法則性が明確で、ノイズが少ないため
化学・生物0.8 以上実験データで再現性が高い
ビジネス・経済0.5 〜 0.7多くの外部要因が関わるため
マーケティング0.4 〜 0.6消費者行動のばらつきが大きい
株価・金融0.1 〜 0.3市場のランダム性が高い
社会科学・人間行動0.2 〜 0.4複雑な要因が絡むため
ルミィ
ルミィ

株価予測でR²=0.2なら「低すぎ」って思うかもしれないけど、実は金融分野では十分実用的なレベルなんだ。「現状より少し当たる予測」が大きな利益を生む世界だからね。R²の数値だけで判断せず、その分野の常識と照らし合わせるのがコツだよ。

⚠️ R²にまつわる「3つのよくある誤解」

誤解1:R²が高ければ良いモデル?

実はそうとは限らないんだ。R²が極端に高い(0.95以上など)場合は、過学習の可能性があるよ。

  • 訓練データには完璧に当てはまるが、新しいデータには弱い
  • 変数を入れすぎると機械的にR²が上がる
  • 見分け方:訓練データのR²とテストデータのR²の差を見る

「R²=0.99だ!完璧!」って喜んでいたら、テストデータでR²=0.4だった、なんてことも普通に起きるよ。

誤解2:R²が低い=使えないモデル?

これも違う場合がある。例えば株価予測でR²=0.2でも、その予測精度で十分利益が出ることもあるんだ。重要なのは:

  • その分野の標準と比較してどうか
  • 統計的に有意(P値が小さい)かどうか
  • ビジネス的・実用的な価値があるか
ルミィ
ルミィ

R²の数値だけ見て「ダメなモデル」と決めつけるのはもったいないよ。実は「現状より少し当たる」だけで、ビジネスに大きなインパクトが出る場面はたくさんあるんだ。

誤解3:R²は因果関係を示す?

R²が示すのは「相関」と「予測精度」だけ。因果関係(原因→結果の関係)は示さないよ。

  • 例:「アイスの売上」と「水難事故件数」は強い相関 → でも因果関係はない(共通原因は気温)
  • R²が高くても「Aを増やせばBが増える」とは言えない
  • 因果関係を主張するには、追加の検証(実験・先行研究)が必要
ルミィ
ルミィ

R²の見方が分かってきたかな?「もっと体系的にデータ分析を学びたい」って思った人には、下の本がおすすめだよ。Excelで機械学習の基本を体験できる定番書で、R²をはじめとした評価指標が実例で理解できるんだ。

📚 評価指標を実例で学びたい人へ
Excelで機械学習の代表的な手法を体験できる定番書。R²やP値などの評価指標を、実データを通して直感的に理解できるよ。

🔄 補正R²との違いと使い分け

補正R²って何?

補正R²(adjusted R²)は、変数の数を考慮して調整した決定係数だよ。

補正R² = 1 - (1 - R²) × (n - 1) / (n - k - 1)

n:サンプル数
k:説明変数の数

なぜ補正R²が必要?

普通のR²には、「変数を増やすほど機械的に上がる」という欠点があるんだ。

  • 無関係な変数を追加してもR²は下がらない(むしろ少し上がる)
  • だから「変数を増やしまくれば高いR²が出せる」状態になっちゃう
  • これだと「本当に良いモデル」を判断できない

補正R²は変数の数にペナルティを課すから、意味のある変数だけ残しているかを判断できるんだ。

使い分けの目安

シーン使う指標
単回帰分析(変数1つ)
重回帰分析(変数複数)補正R²
変数選択の判断補正R²
モデル間の比較補正R²
ルミィ
ルミィ

簡単に言うと、変数が複数あるなら補正R²を見ておけば間違いなし!R²と補正R²の差が大きい時は、変数を入れすぎているサインだから、変数を絞ることを検討してみてね。

🔍 R²をどう実務で使うか

① モデル間の比較

複数のモデル(変数の組み合わせを変えたもの)を作ったとき、どれが一番良いかを比較するのに使えるよ。

  • モデルA(変数3つ):補正R² = 0.65
  • モデルB(変数5つ):補正R² = 0.62
  • → 変数を増やしたBより、Aの方が「良いモデル」と判断

② 変数選択の判断材料

変数を1つ追加して補正R²が大きく上がるなら有用、変わらないか下がるなら不要、と判断できるよ。

③ 報告・プレゼン時の根拠

「このモデルはR²=0.78で、ビジネス指標を77.6%説明できます」のように、説得力のある根拠として使えるよ。

💻 Excelで決定係数を確認する方法

方法1:分析ツールの回帰分析

  • 「データ」タブ →「データ分析」→「回帰分析」
  • 結果シートの最上部「回帰統計」セクションに表示される
  • 「重決定 R2」と「補正 R2」が両方確認できる

方法2:散布図の近似曲線オプション

  • 散布図を作成 → データ点を右クリック →「近似曲線の追加」
  • 「グラフにR-2乗値を表示する」にチェック
  • グラフ上にR²の値が表示される

方法3:RSQ関数

=RSQ(目的変数の範囲, 説明変数の範囲)

例:=RSQ(B2:B100, A2:A100)

単回帰の場合のみ使える簡易な方法だよ。

🎯 R²を見るときの実践的チェックリスト

回帰分析の結果を見たら、R²について以下をチェックしよう。

  • ✅ 分野の標準と比較して妥当か?
  • ✅ R²と補正R²の差は大きすぎないか?(変数を入れすぎていないか)
  • ✅ 訓練データとテストデータでR²の差は大きすぎないか?(過学習していないか)
  • ✅ R²だけでなく、P値や残差プロットも確認したか?
  • ✅ ビジネス的・実用的に意味のある精度か?
ルミィ
ルミィ

チェックリストを使いこなせるようになると、回帰分析の結果を一段深く理解できるよ。「実践でもっと色んな分析を試したい」って人には、下の本がおすすめ。Excelで機械学習の代表的な手法を一通り体験できる、初心者から中級者まで使える定番書なんだ。

💼 実践力を磨きたい人へ
Excelで機械学習の主要手法を体験できる定番書。線形回帰・重回帰の評価から、その先の分析手法まで一貫して学べるよ。

❓ よくある質問(FAQ)

Q1. R²が0.5って良いの?悪いの?

分野次第だよ。物理学なら低すぎ、ビジネスなら平均的、株価予測なら優秀、というふうに評価が変わるんだ。「分野の常識的水準と比べてどうか」が判断基準だよ。

Q2. R²と相関係数(r)の違いは?

単回帰の場合、R² = r² の関係にあるよ。例えば相関係数 r=0.8 なら、R² = 0.64 になるんだ。重回帰では「重相関R」という別の値になるけど、関係性は似ているよ。

Q3. R²がマイナスになることってある?

テストデータでの評価では起こり得るよ。「平均値で予測するより悪い」状態を意味するから、モデルがデータに対して全く機能していない、つまり特徴量の見直しが必要だよ。

Q4. 訓練データのR²とテストデータのR²、どちらを信じるべき?

テストデータのR²を信じよう。訓練データは「答えを見ながら勉強した結果」、テストデータは「初見の問題で解いた結果」みたいなもの。実用上の精度はテストデータの方が正直だよ。

Q5. R²が低いモデルはどう改善する?

  • 変数の追加:影響しそうな要因を探して入れる
  • 変数の変換:対数化・標準化・組み合わせ
  • 外れ値の処理:異常値を除外または補正
  • 非線形モデルへ移行:多項式回帰・決定木・ランダムフォレスト

Q6. 補正R²が普通のR²より低いのはなぜ?

補正R²は変数の数にペナルティを課すから、必ず R²以下になるよ。差が小さい(0.01〜0.02程度)なら問題なし、大きい(0.1以上)なら変数を入れすぎているサインだよ。

🎉 まとめ

決定係数R²は、回帰モデルの精度を判断する最重要指標。でも数値だけで判断せず、文脈と一緒に解釈するのが正解だよ。

今回押さえたポイント:

  • R²は「モデルがデータのばらつきをどれくらい説明できるか」
  • 0〜1の範囲で、1に近いほど良い(マイナスもあり得る)
  • 良い基準は分野によって全く違う
  • 重回帰では補正R²の方を見る
  • R²だけでなく、P値・残差・テストデータでの精度も併せて判断
  • 高すぎるR²は過学習のサイン

次のステップ:

  • 実際の回帰分析でR²と補正R²を比較してみる
  • 異なる変数セットでモデルを作り、補正R²で比較
  • 残差プロットなど他の評価方法も組み合わせる
ルミィ
ルミィ

R²のことが分かってくると、回帰分析の結果が立体的に見えてくるよ。次のステップに進みたい人には、下の本がおすすめ。Excelをそのまま使って、機械学習の評価指標を実例ベースで理解できる定番書なんだ。Pythonに進む前のステップとしてもバッチリだよ。

🚀 評価指標を使いこなしたい人へ
Excelで機械学習を体験できる定番書。R²をはじめとした評価指標を実データで腹落ちさせたい人にぴったりの1冊だよ。

📍 もっとAIを知りたい方へ

迷ったら、まずは AIの地図 から。目的別にぴったりのAIが見つかります。

同じ「データ分析・機械学習」カテゴリの関連記事

ルミィ
ルミィ
AIナビゲーター
ChatGPTにハマってから毎日AIを触り続けるブログ運営者。最新AIツールを初心者目線で発信しています。YouTubeでも解説動画を投稿中!
記事URLをコピーしました