AIの最新情報・実演を動画でチェック

*当ブログではアフィリエイト広告を利用しています。

データ分析・機械学習

決定係数R²とは?線形回帰の精度の見方を徹底解説【2026年最新版・初心者向け】

決定係数R²とは|回帰直線の当てはまりの良さをメーターと散布図で可視化したイメージ
ルミィ

🎯 はじめに

この記事は「機械学習入門」シリーズの1本です。AIの全体像から知りたい方はAIの地図|目的別にAIツールを探す、分析手法を順番に学びたい方はデータ分析・機械学習カテゴリもあわせてご覧ください。

📖 まずは線形回帰の基礎から学びたい方は 線形回帰分析とは?やり方から活用法まで徹底解説 をご覧ください。

📅 最終更新:2026年4月26日(新規公開)
✅ 数式が苦手な人でもわかる図解中心の解説
✅ 分野別の「良いR²の目安」一覧表付き
✅ 補正R²との違いも完全カバー
✅ よくある誤解・落とし穴も収録
✅ FAQで疑問を一気に解消

決定係数R²は「モデルがデータのばらつきをどれくらい説明できるか」を示す指標。ただし、良い数値の基準は分野によってまったく違います。R²=0.2でも優秀なモデルがあれば、R²=0.9でも過学習の疑いがある場合もあります。

「決定係数R²ってよく聞くけど、結局何を表してるの?」「いくつあれば良いの?」

回帰分析を学んでいると必ず出会う「決定係数R²」。実はこの数値、線形回帰モデルがデータのばらつきをどれくらい説明できているかを見る代表的な指標なんだ。でも分野によって「良い基準」が違ったり、補正R²との使い分けが難しかったりして、初心者がつまずきやすいポイントでもあるよ。私自身も最初は「R²=0.7って良いの悪いの?」と迷った経験があるので、その悩みをまとめてほぐしていくよ。

ルミィ
ルミィ

この記事では、決定係数R²の意味から見方、分野別の目安、補正R²との違い、よくある誤解まで一気に解説していくよ。読み終わるころには、回帰分析の結果を自信を持って解釈できるようになっているはず!

🙋 この記事はこんな人に向いています

  • 回帰分析を学んでいて、R²という指標の意味と解釈がわからない人
  • 「R²はいくつあれば良いのか」と悩んでいる人
  • 補正R²(adjusted R²)との違いがよくわからない人
  • 過学習とR²の関係を理解したい人
  • ExcelやPythonでR²を計算・確認する方法を知りたい人

📊 決定係数R²って何?

一言でいうと「モデルの説明力」

決定係数R²は、回帰モデルが目的変数のばらつきをどれくらい説明できているかを示す指標だよ。

  • 範囲:0 〜 1(一部の場合はマイナスも)
  • 1に近いほど:そのデータへの当てはまりが良い
  • 0に近いほど:モデルの説明力が低い(当てはまりが悪い)
  • 未知データへの予測力は、テストデータや交差検証でも確認する必要がある
ルミィ
ルミィ

R²=0.75 だったら、「このモデルはデータのばらつきの75%を説明できている」って意味だよ。残りの25%は、モデルに含まれていない他の要因で動いている部分、と考えるとイメージしやすいかも。

数式(怖くないよ)

数式で書くとこんな感じだけど、覚える必要はないよ。

R² = 1 - (残差の二乗和) / (全変動の二乗和)
    = 1 - SSres / SStot

意味:
- SSres:モデルで説明できなかったばらつき
- SStot:データ全体のばらつき
- R²:説明できたばらつきの割合

要するに「全体のばらつきのうち、モデルで説明できた部分の割合」ってこと。直感的にわかりやすいよね。

📏 分野別「良いR²」の目安

「R²はいくつあれば良いの?」という質問の答えは、分野によって全然違うんだ。以下はあくまでざっくりした目安で、実際にはデータの種類・予測期間・ノイズの大きさ・目的によって評価は変わるよ。

分野良好な範囲理由
物理・工学0.9 以上法則性が明確で、ノイズが少ないため
化学・生物0.8 以上実験データで再現性が高い
ビジネス・経済0.5 〜 0.7多くの外部要因が関わるため
マーケティング0.4 〜 0.6消費者行動のばらつきが大きい
株価・金融低めになりやすい市場ノイズや外部要因が大きく、R²だけで実用性は判断しにくい
社会科学・人間行動0.2 〜 0.4複雑な要因が絡むため
ルミィ
ルミィ

金融分野ではR²が低く出ることも多いけど、それだけで良し悪しは判断できないよ。予測期間、取引コスト、リスク管理、テストデータでの成績まで合わせて見るのが大事なんだ。

⚠️ R²にまつわる「3つのよくある誤解」

誤解1:R²が高ければ良いモデル?

実はそうとは限らないんだ。R²が極端に高い(0.95以上など)場合は、過学習の可能性があるよ。

  • 訓練データには完璧に当てはまるが、新しいデータには弱い
  • 変数を入れすぎると機械的にR²が上がる
  • 見分け方:訓練データのR²とテストデータのR²の差を見る

「R²=0.99だ!完璧!」って喜んでいたら、テストデータでR²=0.4だった、なんてことも普通に起きるよ。

誤解2:R²が低い=使えないモデル?

これも違う場合がある。例えば株価予測でR²=0.2でも、その予測精度で十分利益が出ることもあるんだ。重要なのは:

  • その分野の標準と比較してどうか
  • 統計的に有意(P値が小さい)かどうか
  • ビジネス的・実用的な価値があるか
ルミィ
ルミィ

R²の数値だけ見て「ダメなモデル」と決めつけるのはもったいないよ。実は「現状より少し当たる」だけで、ビジネスに大きなインパクトが出る場面はたくさんあるんだ。

誤解3:R²は因果関係を示す?

R²が示すのは「相関」と「予測精度」だけ。因果関係(原因→結果の関係)は示さないよ。

  • 例:「アイスの売上」と「水難事故件数」は強い相関 → でも因果関係はない(共通原因は気温)
  • R²が高くても「Aを増やせばBが増える」とは言えない
  • 因果関係を主張するには、追加の検証(実験・先行研究)が必要

🔄 補正R²との違いと使い分け

補正R²って何?

補正R²(adjusted R²)は、変数の数を考慮して調整した決定係数だよ。

補正R² = 1 - (1 - R²) × (n - 1) / (n - k - 1)

n:サンプル数
k:説明変数の数

なぜ補正R²が必要?

普通のR²には、「変数を増やすほど機械的に上がる」という欠点があるんだ。

  • 無関係な変数を追加してもR²は下がらない(むしろ少し上がる)
  • だから「変数を増やしまくれば高いR²が出せる」状態になっちゃう
  • これだと「本当に良いモデル」を判断できない

補正R²は変数の数にペナルティを課すから、意味のある変数だけ残しているかを判断できるんだ。

使い分けの目安

シーン使う指標
単回帰分析(変数1つ)
重回帰分析(変数複数)補正R²
変数選択の判断補正R²
モデル間の比較補正R²
ルミィ
ルミィ

変数が複数あるなら、普通のR²だけでなく補正R²も必ず見よう。さらに、テストデータでのR²、RMSE、MAE、残差プロットも合わせて確認すると安心だよ。

🔍 R²をどう実務で使うか

① モデル間の比較

複数のモデル(変数の組み合わせを変えたもの)を作ったとき、どれが一番良いかを比較するのに使えるよ。

  • モデルA(変数3つ):補正R² = 0.65
  • モデルB(変数5つ):補正R² = 0.62
  • → 変数を増やしたBより、Aの方が「良いモデル」と判断

② 変数選択の判断材料

変数を1つ追加して補正R²が大きく上がるなら有用、変わらないか下がるなら不要、と判断できるよ。

③ 報告・プレゼン時の根拠

「このモデルはR²=0.78で、ビジネス指標を78%説明できます」のように、説得力のある根拠として使えるよ。

💻 Excelで決定係数を確認する方法

方法1:分析ツールの回帰分析

  • 「データ」タブ →「データ分析」→「回帰分析」
  • 結果シートの最上部「回帰統計」セクションに表示される
  • 「重決定 R2」と「補正 R2」が両方確認できる

方法2:散布図の近似曲線オプション

  • 散布図を作成 → データ点を右クリック →「近似曲線の追加」
  • 「グラフにR-2乗値を表示する」にチェック
  • グラフ上にR²の値が表示される

方法3:RSQ関数

=RSQ(目的変数の範囲, 説明変数の範囲)

例:=RSQ(B2:B100, A2:A100)

単回帰の場合のみ使える簡易な方法だよ。

🎯 R²を見るときの実践的チェックリスト

回帰分析の結果を見たら、R²について以下をチェックしよう。

  • ✅ 分野の標準と比較して妥当か?
  • ✅ R²と補正R²の差は大きすぎないか?(変数を入れすぎていないか)
  • ✅ 訓練データとテストデータでR²の差は大きすぎないか?(過学習していないか)
  • ✅ R²だけでなく、P値や残差プロットも確認したか?
  • ✅ ビジネス的・実用的に意味のある精度か?

❓ よくある質問(FAQ)

Q1. R²が0.5って良いの?悪いの?

分野次第だよ。物理学なら低すぎ、ビジネスなら平均的、株価予測なら優秀、というふうに評価が変わるんだ。「分野の常識的水準と比べてどうか」が判断基準だよ。

Q2. R²と相関係数(r)の違いは?

単回帰の場合、R² = r² の関係にあるよ。例えば相関係数 r=0.8 なら、R² = 0.64 になるんだ。重回帰では「重相関R」という別の値になるけど、関係性は似ているよ。

Q3. R²がマイナスになることってある?

テストデータでの評価では起こり得るよ。「平均値で予測するより悪い」状態を意味するから、モデルがデータに対して全く機能していない、つまり特徴量の見直しが必要だよ。

Q4. 訓練データのR²とテストデータのR²、どちらを信じるべき?

テストデータのR²を信じよう。訓練データは「答えを見ながら勉強した結果」、テストデータは「初見の問題で解いた結果」みたいなもの。実用上の精度はテストデータの方が正直だよ。

Q5. R²が低いモデルはどう改善する?

  • 変数の追加:影響しそうな要因を探して入れる
  • 変数の変換:対数化・標準化・組み合わせ
  • 外れ値の処理:異常値を除外または補正
  • 非線形モデルへ移行:多項式回帰・決定木・ランダムフォレスト

Q6. 補正R²が普通のR²より低いのはなぜ?

補正R²は変数の数にペナルティを課すため、通常のR²以下になります。R²と補正R²の差が大きい場合は、変数を入れすぎていないか、不要な変数が混ざっていないかを確認しましょう。差が気になるときは、変数を一つずつ外してみて補正R²がどう変わるか確認するのがコツだよ。

🎉 まとめ

決定係数R²は、回帰モデルの精度を判断する重要な指標のひとつ。でも数値だけで判断せず、文脈と一緒に解釈するのが正解だよ。

今回押さえたポイント:

  • R²は「モデルがデータのばらつきをどれくらい説明できるか」
  • 0〜1の範囲で、1に近いほど良い(マイナスもあり得る)
  • 良い基準は分野によって全く違う
  • 重回帰では補正R²の方を見る
  • R²だけでなく、P値・残差・テストデータでの精度も併せて判断
  • 高すぎるR²は過学習のサイン

今すぐ試せる次の一歩:
1. 手元のデータで回帰分析を実行して、R²と補正R²の両方を確認する
2. 異なる変数セットでモデルを2〜3個作り、補正R²で比較する
3. 訓練データとテストデータに分けて、R²の差が大きくないか確認する

ルミィ
ルミィ

R²のことが分かってくると、回帰分析の結果が立体的に見えてくるよ。次のステップに進みたい人には、下の本がおすすめ。Excelをそのまま使って、機械学習の評価指標を実例ベースで理解できる定番書なんだ。Pythonに進む前のステップとしてもバッチリだよ。

🚀 評価指標を使いこなしたい人へ
Excelで機械学習を体験できる定番書。R²をはじめとした評価指標を実データで腹落ちさせたい人にぴったりの1冊だよ。

📍 もっとAIを知りたい方へ

迷ったら、まずは AIの地図 から。目的別にぴったりのAIが見つかります。

同じ「データ分析・機械学習」カテゴリの関連記事

次に読むおすすめ記事

ルミィ
ルミィ
AIナビゲーター
ChatGPT・Gemini・Claudeなどの会話AI、画像生成AI、動画生成AI、資料作成AI、AI検索ツールを初心者向けに解説するAIナビゲーター。実際に使ってみた感想や、仕事・学習・発信に役立つAI活用法をわかりやすく紹介しています。
記事URLをコピーしました