R²と相関係数（r）の違いは何ですか？

単回帰の場合、R² = r²の関係にあります。例えば相関係数r=0.8なら、R² = 0.64になります。重回帰では「重相関R」という別の値になりますが、関係性は似ています。

R²がマイナスになることはありますか？

テストデータでの評価では起こり得ます。「平均値で予測するより悪い」状態を意味するため、モデルがデータに対して全く機能していないことを示します。特徴量の見直しが必要です。

訓練データのR²とテストデータのR²、どちらを信じるべきですか？

テストデータのR²を信じましょう。訓練データは「答えを見ながら勉強した結果」、テストデータは「初見の問題で解いた結果」のようなものです。実用上の精度はテストデータの方が正直です。

R²が低いモデルはどう改善できますか？

変数の追加（影響しそうな要因を探す）、変数の変換（対数化・標準化・組み合わせ）、外れ値の処理、非線形モデル（多項式回帰・決定木・ランダムフォレスト）への移行などが有効です。

2026.04.26 2026.07.11

データ分析・機械学習

決定係数R²とは？線形回帰の精度の見方を徹底解説【2026年最新版・初心者向け】

Q: R²が0.5って良いの？悪いの？

分野次第です。物理学なら低すぎ、ビジネスなら平均的、株価予測では低めでも珍しくありません。「分野の常識的水準と比べてどうか」が判断基準です。

ルミィ

決定係数 R²、見たことあるけど、結局どこまで高ければOK？って迷うよね

回帰分析の出力で必ず出てくる R²（決定係数）。「高いほど良い」と覚えている人は多いですが、「0.8以上ならOK」「0.5でも分野によっては優秀」など、判断基準は分野や用途で大きく異なります。

ルミィ

私もね、最初は『R² = 0.7 で大丈夫？』って毎回不安になってたんだ

この記事は、決定係数 R² の正しい読み方を、初心者向けに丁寧に解説するガイドです。R² の定義、調整済み R² との違い、業界別の目安、過学習との関係、R² が高くてもダメな例、補完すべき他の指標（MSE・MAE・AIC）まで網羅。回帰分析の結果を自信を持って解釈したい全ての人向けです。

Contents

🎯 はじめに
🙋 この記事はこんな人に向いています
📊 決定係数R²って何？
- 一言でいうと「モデルの説明力」
- 数式（怖くないよ）
📏 分野別「良いR²」の目安
⚠️ R²にまつわる「3つのよくある誤解」
🔄 補正R²との違いと使い分け
🔍 R²をどう実務で使うか
💻 Excelで決定係数を確認する方法
🎯 R²を見るときの実践的チェックリスト
❓ よくある質問（FAQ）
🎉 まとめ
次に読むおすすめ記事

🎯 はじめに

この記事は「機械学習入門」シリーズの1本です。AIの全体像から知りたい方はAIの地図｜目的別にAIツールを探せる一覧ガイド【2026年】、分析手法を順番に学びたい方はデータ分析・機械学習カテゴリもあわせてご覧ください。

📖 まずは線形回帰の基礎から学びたい方は 線形回帰分析とは？やり方から活用法まで徹底解説 をご覧ください。

📅 最終更新：2026年6月13日（図解を追加）
✅ 数式が苦手な人でもわかる図解中心の解説
✅ 分野別の「良いR²の目安」一覧表付き
✅ 補正R²との違いも完全カバー
✅ よくある誤解・落とし穴も収録
✅ FAQで疑問を一気に解消

決定係数R²は「モデルがデータのばらつきをどれくらい説明できるか」を示す指標。ただし、良い数値の基準は分野によってまったく違います。R²=0.2でも優秀なモデルがあれば、R²=0.9でも過学習の疑いがある場合もあります。

「決定係数R²ってよく聞くけど、結局何を表してるの？」「いくつあれば良いの？」

回帰分析を学んでいると必ず出会う「決定係数R²」。実はこの数値、線形回帰モデルがデータのばらつきをどれくらい説明できているかを見る代表的な指標なんだ。でも分野によって「良い基準」が違ったり、補正R²との使い分けが難しかったりして、初心者がつまずきやすいポイントでもあるよ。私自身も最初は「R²=0.7って良いの悪いの？」と迷った経験があるので、その悩みをまとめてほぐしていくよ。

ルミィ

この記事では、決定係数R²の意味から見方、分野別の目安、補正R²との違い、よくある誤解まで一気に解説していくよ。読み終わるころには、回帰分析の結果を自信を持って解釈できるようになっているはず！

🙋 この記事はこんな人に向いています

回帰分析を学んでいて、R²という指標の意味と解釈がわからない人
「R²はいくつあれば良いのか」と悩んでいる人
補正R²（adjusted R²）との違いがよくわからない人
過学習とR²の関係を理解したい人
ExcelやPythonでR²を計算・確認する方法を知りたい人

📊 決定係数R²って何？

一言でいうと「モデルの説明力」

決定係数R²は、回帰モデルが目的変数のばらつきをどれくらい説明できているかを示す指標だよ。

範囲：0 〜 1（一部の場合はマイナスも）
1に近いほど：そのデータへの当てはまりが良い
0に近いほど：モデルの説明力が低い（当てはまりが悪い）
未知データへの予測力は、テストデータや交差検証でも確認する必要がある

ルミィ

R²＝0.75 だったら、「このモデルはデータのばらつきの75%を説明できている」って意味だよ。残りの25%は、モデルに含まれていない他の要因で動いている部分、と考えるとイメージしやすいかも。

決定係数R²の図解。左はR²が高く点が回帰直線の近くに集まり、右はR²が低く点が大きく散らばる散布図の対比。 — 図：左はR²が高い（点が線に近い＝予測が当たる）、右はR²が低い（点が散らばる＝予測が外れやすい）状態です。

数式（怖くないよ）

数式で書くとこんな感じだけど、覚える必要はないよ。

R² = 1 - (残差の二乗和) / (全変動の二乗和)
    = 1 - SSres / SStot

意味：
- SSres：モデルで説明できなかったばらつき
- SStot：データ全体のばらつき
- R²：説明できたばらつきの割合

要するに「全体のばらつきのうち、モデルで説明できた部分の割合」ってこと。直感的にわかりやすいよね。

📏 分野別「良いR²」の目安

「R²はいくつあれば良いの？」という質問の答えは、分野によって全然違うんだ。以下はあくまでざっくりした目安で、実際にはデータの種類・予測期間・ノイズの大きさ・目的によって評価は変わるよ。

分野	良好な範囲	理由
物理・工学	0.9 以上	法則性が明確で、ノイズが少ないため
化学・生物	0.8 以上	実験データで再現性が高い
ビジネス・経済	0.5 〜 0.7	多くの外部要因が関わるため
マーケティング	0.4 〜 0.6	消費者行動のばらつきが大きい
株価・金融	低めになりやすい	市場ノイズや外部要因が大きく、R²だけで実用性は判断しにくい
社会科学・人間行動	0.2 〜 0.4	複雑な要因が絡むため

ルミィ

金融分野ではR²が低く出ることも多いけど、それだけで良し悪しは判断できないよ。予測期間、取引コスト、リスク管理、テストデータでの成績まで合わせて見るのが大事なんだ。

⚠️ R²にまつわる「3つのよくある誤解」

誤解1：R²が高ければ良いモデル？

実はそうとは限らないんだ。R²が極端に高い（0.95以上など）場合は、過学習の可能性があるよ。

訓練データには完璧に当てはまるが、新しいデータには弱い
変数を入れすぎると機械的にR²が上がる
見分け方：訓練データのR²とテストデータのR²の差を見る

「R²=0.99だ！完璧！」って喜んでいたら、テストデータでR²=0.4だった、なんてことも普通に起きるよ。

誤解2：R²が低い＝使えないモデル？

これも違う場合がある。例えば株価予測でR²=0.2でも、その予測精度で十分利益が出ることもあるんだ。重要なのは：

その分野の標準と比較してどうか
統計的に有意（P値が小さい）かどうか
ビジネス的・実用的な価値があるか

ルミィ

R²の数値だけ見て「ダメなモデル」と決めつけるのはもったいないよ。実は「現状より少し当たる」だけで、ビジネスに大きなインパクトが出る場面はたくさんあるんだ。

誤解3：R²は因果関係を示す？

R²が示すのは「相関」と「予測精度」だけ。因果関係（原因→結果の関係）は示さないよ。

例：「アイスの売上」と「水難事故件数」は強い相関 → でも因果関係はない（共通原因は気温）
R²が高くても「Aを増やせばBが増える」とは言えない
因果関係を主張するには、追加の検証（実験・先行研究）が必要

🔄 補正R²との違いと使い分け

補正R²って何？

補正R²（adjusted R²）は、変数の数を考慮して調整した決定係数だよ。

補正R² = 1 - (1 - R²) × (n - 1) / (n - k - 1)

n：サンプル数
k：説明変数の数

なぜ補正R²が必要？

普通のR²には、「変数を増やすほど機械的に上がる」という欠点があるんだ。

無関係な変数を追加してもR²は下がらない（むしろ少し上がる）
だから「変数を増やしまくれば高いR²が出せる」状態になっちゃう
これだと「本当に良いモデル」を判断できない

補正R²は変数の数にペナルティを課すから、意味のある変数だけ残しているかを判断できるんだ。

使い分けの目安

シーン	使う指標
単回帰分析（変数1つ）	R²
重回帰分析（変数複数）	補正R²
変数選択の判断	補正R²
モデル間の比較	補正R²

ルミィ

変数が複数あるなら、普通のR²だけでなく補正R²も必ず見よう。さらに、テストデータでのR²、RMSE、MAE、残差プロットも合わせて確認すると安心だよ。

🔍 R²をどう実務で使うか

① モデル間の比較

複数のモデル（変数の組み合わせを変えたもの）を作ったとき、どれが一番良いかを比較するのに使えるよ。

モデルA（変数3つ）：補正R² = 0.65
モデルB（変数5つ）：補正R² = 0.62
→ 変数を増やしたBより、Aの方が「良いモデル」と判断

② 変数選択の判断材料

変数を1つ追加して補正R²が大きく上がるなら有用、変わらないか下がるなら不要、と判断できるよ。

③ 報告・プレゼン時の根拠

「このモデルはR²=0.78で、ビジネス指標を78%説明できます」のように、説得力のある根拠として使えるよ。

💻 Excelで決定係数を確認する方法

方法1：分析ツールの回帰分析

「データ」タブ →「データ分析」→「回帰分析」
結果シートの最上部「回帰統計」セクションに表示される
「重決定 R2」と「補正 R2」が両方確認できる

方法2：散布図の近似曲線オプション

散布図を作成 → データ点を右クリック →「近似曲線の追加」
「グラフにR-2乗値を表示する」にチェック
グラフ上にR²の値が表示される

方法3：RSQ関数

=RSQ(目的変数の範囲, 説明変数の範囲)

例：=RSQ(B2:B100, A2:A100)

単回帰の場合のみ使える簡易な方法だよ。

🎯 R²を見るときの実践的チェックリスト

回帰分析の結果を見たら、R²について以下をチェックしよう。

✅ 分野の標準と比較して妥当か？
✅ R²と補正R²の差は大きすぎないか？（変数を入れすぎていないか）
✅ 訓練データとテストデータでR²の差は大きすぎないか？（過学習していないか）
✅ R²だけでなく、P値や残差プロットも確認したか？
✅ ビジネス的・実用的に意味のある精度か？

❓ よくある質問（FAQ）

Q1. R²が0.5って良いの？悪いの？

分野次第だよ。物理学なら低すぎ、ビジネスなら平均的、株価予測なら優秀、というふうに評価が変わるんだ。「分野の常識的水準と比べてどうか」が判断基準だよ。

Q2. R²と相関係数（r）の違いは？

単回帰の場合、R² = r² の関係にあるよ。例えば相関係数 r=0.8 なら、R² = 0.64 になるんだ。重回帰では「重相関R」という別の値になるけど、関係性は似ているよ。

Q3. R²がマイナスになることってある？

テストデータでの評価では起こり得るよ。「平均値で予測するより悪い」状態を意味するから、モデルがデータに対して全く機能していない、つまり特徴量の見直しが必要だよ。

Q4. 訓練データのR²とテストデータのR²、どちらを信じるべき？

テストデータのR²を信じよう。訓練データは「答えを見ながら勉強した結果」、テストデータは「初見の問題で解いた結果」みたいなもの。実用上の精度はテストデータの方が正直だよ。

Q5. R²が低いモデルはどう改善する？

変数の追加：影響しそうな要因を探して入れる
変数の変換：対数化・標準化・組み合わせ
外れ値の処理：異常値を除外または補正
非線形モデルへ移行：多項式回帰・決定木・ランダムフォレスト

Q6. 補正R²が普通のR²より低いのはなぜ？

補正R²は変数の数にペナルティを課すため、通常のR²以下になります。R²と補正R²の差が大きい場合は、変数を入れすぎていないか、不要な変数が混ざっていないかを確認しましょう。差が気になるときは、変数を一つずつ外してみて補正R²がどう変わるか確認するのがコツだよ。

🎉 まとめ

決定係数R²は、回帰モデルの精度を判断する重要な指標のひとつ。でも数値だけで判断せず、文脈と一緒に解釈するのが正解だよ。

今回押さえたポイント：

R²は「モデルがデータのばらつきをどれくらい説明できるか」
0〜1の範囲で、1に近いほど良い（マイナスもあり得る）
良い基準は分野によって全く違う
重回帰では補正R²の方を見る
R²だけでなく、P値・残差・テストデータでの精度も併せて判断
高すぎるR²は過学習のサイン

今すぐ試せる次の一歩：
1. 手元のデータで回帰分析を実行して、R²と補正R²の両方を確認する
2. 異なる変数セットでモデルを2〜3個作り、補正R²で比較する
3. 訓練データとテストデータに分けて、R²の差が大きくないか確認する

ルミィ

R²のことが分かってくると、回帰分析の結果が立体的に見えてくるよ。次のステップに進みたい人には、下の本がおすすめ。Excelをそのまま使って、機械学習の評価指標を実例ベースで理解できる定番書なんだ。Pythonに進む前のステップとしてもバッチリだよ。

🚀 評価指標を使いこなしたい人へ
Excelで機械学習を体験できる定番書。R²をはじめとした評価指標を実データで腹落ちさせたい人にぴったりの1冊だよ。

直感でわかる! Excelで機械学習

Amazon

楽天市場

Yahooショッピング

ポチップ

📍 もっとAIを知りたい方へ

迷ったら、まずは AIの地図 から。目的別にぴったりのAIが見つかります。

同じ「データ分析・機械学習」カテゴリの関連記事

次に読むおすすめ記事

📊 関連：決定係数R²は、単回帰では相関係数を二乗した値に一致します。その大もとの考え方は相関とは？相関係数と「相関≠因果」で図解しています。

🗺️ データ分析の地図（統計・機械学習を学ぶ順番）で全体を見る

#初心者向け #機械学習 #決定係数 #統計学 #線形回帰

ABOUT ME

決定係数R²とは？線形回帰の精度の見方を徹底解説【2026年最新版・初心者向け】

🎯 はじめに

🙋 この記事はこんな人に向いています

📊 決定係数R²って何？

一言でいうと「モデルの説明力」

数式（怖くないよ）

📏 分野別「良いR²」の目安

⚠️ R²にまつわる「3つのよくある誤解」

誤解1：R²が高ければ良いモデル？

誤解2：R²が低い＝使えないモデル？

誤解3：R²は因果関係を示す？

🔄 補正R²との違いと使い分け

補正R²って何？

なぜ補正R²が必要？

使い分けの目安

🔍 R²をどう実務で使うか

① モデル間の比較

② 変数選択の判断材料

③ 報告・プレゼン時の根拠

💻 Excelで決定係数を確認する方法

方法1：分析ツールの回帰分析

方法2：散布図の近似曲線オプション

方法3：RSQ関数

🎯 R²を見るときの実践的チェックリスト

❓ よくある質問（FAQ）

Q1. R²が0.5って良いの？悪いの？

Q2. R²と相関係数（r）の違いは？

Q3. R²がマイナスになることってある？

Q4. 訓練データのR²とテストデータのR²、どちらを信じるべき？

Q5. R²が低いモデルはどう改善する？

Q6. 補正R²が普通のR²より低いのはなぜ？

🎉 まとめ

次に読むおすすめ記事

ヒストグラムとは？作り方と見方・棒グラフとの違いをやさしく図解

SVM（サポートベクターマシン）とは？仕組みをやさしく図解

機械学習の3つの学び方｜教師あり・教師なし・強化学習をやさしく図解

主成分分析（PCA）とは？次元削減で情報を大事な軸に圧縮する仕組みを解説

ノーコードで始めるAIデータ分析｜初心者向け5ツール比較【2026年版】

Excelで時系列予測｜移動平均・指数平滑・予測シートのやり方