次の DEMO を見にいく

*当ブログではアフェリエイト広告を利用しています。

データ分析・機械学習

Excelでできる!住宅価格データの線形回帰分析入門【2026年最新版・初心者向け】

Excel linear regression analysis tutorial showing scatter plot graphs and housing price data on laptop screen with real estate documents on desk
momeq

📅 最終更新:2026年4月26日(公開:2025年8月)
✅ Excel 2024 / Microsoft 365で動作確認済み
✅ プログラミング不要・初心者でも30分で完了
✅ サンプルCSVデータ無料配布
✅ 重回帰分析への発展編・FAQも収録

**「線形回帰分析って難しそう…」**と思っていませんか?

実は、お馴染みのExcelを使えば、プログラミングの知識がなくても本格的な統計分析ができるんです。今回は、住宅価格データを使って、面積や部屋数などの条件が価格にどう影響するかを分析してみましょう。

線形回帰分析って何?

線形回帰分析とは、「AがBに与える影響の大きさ」を数値で表す統計手法です。

例えば:

  • 「面積が1㎡増えると、価格は何万円上がる?」
  • 「築年数が1年増えると、価格は何万円下がる?」

こういった関係性を、データから客観的に読み取ることができます。

ルミィ
ルミィ

「線形」って聞くと「直線で大丈夫なの?」って思うよね。確かに不動産価格は曲線的にも見えるけど、線形回帰でも実用的な精度が出ることが多いんだよ。

ルミィ
ルミィ

まずは線形から始めて、必要なら曲線回帰にステップアップしていけば大丈夫。シンプルだけど、ビジネスの現場で本当によく使われている手法なんだ。

📚 線形回帰の理論的な背景や、Excel以外のツール(Python、Rなど)でのやり方をもっと深く知りたい人は、こちらの記事も参考にしてみてね。
👉 線形回帰分析とは?やり方から活用法まで徹底解説

準備:サンプルデータについて

今回使用するのは、架空の住宅価格データです。以下の項目が含まれています:

列名説明
area_sqm専有面積(㎡)
rooms部屋数
age_years築年数
station_distance_min最寄り駅からの距離(分)
floor階数
price_million_yen価格(万円)← 目的変数Y、これを予測したい
ルミィ
ルミィ

今回はCSV形式のサンプルデータを用意したよ。下のリンクからダウンロードして、一緒に手を動かしながら進めてみてね。

ルミィ
ルミィ

ダウンロードしたら、まずはどんなデータか中身をざっくり眺めてみよう。全体像をつかんでから分析に入ると、結果の解釈がぐっと楽になるよ。

ルミィ
ルミィ

下の表は最小・最大・平均・中央値をまとめたものだよ。例えば部屋数なら、最小1部屋、最大6部屋、平均3.54部屋、中央値3部屋って感じ。こうやって統計の基本指標を見ると、データの偏りがすぐに分かるんだ。

変数名最小値最大値平均中央値
area_sqm20.658006149.08542384.81302386.711287
rooms1.0000006.0000003.5340003.000000
age_years0.01187649.96767525.93761226.498170
station_distance_min1.00964329.86893415.19762015.179237
floor1.00000014.0000007.4620007.000000
price_million_yen506.6486572989.9040661749.9261733.422

ステップ1:データの読み込み

まずは、ExcelにCSVデータを読み込みましょう。そのままCSVを開いてもいいけど、文字化けすることあるので、今回はExcelのデータから開きます。

Excelを開く

まずは、PC内でインストールされているExcelを開いてください。

「データ」タブ → 「テキストまたはCSVから」を選択

リボンのデータタブ内にある「テキストまたはCSVから」を選択して、対象のファイルを選んで「インポート」を押してください。

対象のCSVファイルを選んで読み込み

今回はそのまま読み込めそうなので読み込みを押して、データを読み込めば反映されます。

※バージョンによって使えなかったり、方法が違う場合があります。
※また、1行目に項目名(ヘッダー)があることを確認してください。

ステップ2:分析ツールを有効にする

Excelの「分析ツール」は初期状態では無効になっています。以下の手順で有効化しましょう。

メニューから 「ファイル」→「オプション」をクリック

開いた状態で左上にある「ファイル」押します。すると画面が変わり、保存とか印刷とかが左に出てきます。一番下に「オプション」があるので、こちらをクリックしてください。

Excelのオプションにある「アドイン」内の「設定(G)…」をクリック

オプション内には数式やデータ等色々ありますが、下のほうに「アドイン」があります。アドイン内の下部にある「管理」欄を「Excelアドイン」にして「設定(G)…」をクリックしてください。

有効なアドイン内の「分析ツール」にチェックを入れ、「OK」をクリック

設定内では有効なアドインを選択できると思います。ここで、「分析ツール」を選んでチェックを入れてください。「OK」をクリックすると選択が反映されます。

データタブ内に「データ分析」があれば完了です。

トップ画面に戻り、データタブ内の右側に分析:データ分析のタブが反映されていれば設定完了です。

すると、「データ」タブに「データ分析」ボタンが追加されます。

ルミィ
ルミィ

ちょっと注意ポイント!Microsoft 365やExcel for Macだと、分析ツールの場所が少し違うことがあるんだ。バージョンによっては「分析ツール – VBA」も一緒にチェックを入れておくと安心だよ。

ステップ3:回帰分析を実行する

いよいよ分析開始です!

  1. 「データ」タブ から「データ分析」をクリック
  2. 「回帰分析」 を選択 → 「OK」

回帰分析を選択状態にして「OK」をクリックします。

すると、回帰分析用の入力欄として次のような画面が出てきます。

ここでは大きく分けて4つ、さらに詳細な入力欄に分かれています。

  • 入力元
    • 入力Y範囲
    • 入力X範囲
    • ラベル
    • 定数に0を使用
    • 有意水準
  • 出力オプション
    • 一覧の出力先
    • 新規ワークシート
    • 新規ブック
  • 残差
    • 残差
    • 残差グラフの作成
    • 標準化された残差
    • 観測値グラフの作成
  • 正規確率
    • 正規確率グラフの作成

基本設定

  1. 以下のように設定します:
    • 入力Y範囲$F$1:$F$501(目的変数:価格)
    • 入力X範囲$A$1:$E$501(説明変数:面積、部屋数、築年数、駅距離、階数)
    • 出力オプション:新規ワークシート
    • 入力元のラベル(L):チェック ← 1行目をラベルとして認識

詳細オプションの説明

基本的にはチェック不要ですが、知っておくと便利なオプション:

  • 残差:実際の価格と予測価格の差を計算
  • 残差グラフの作成:予測の精度を視覚的に確認
  • 標準化された残差:外れ値(異常なデータ)を発見
  • 観測値のグラフ作成:実測値vs予測値の比較グラフ

ステップ4:結果の読み方

分析が完了すると、新しいシートに結果が表示されます。重要なポイントを見ていきましょう。

■ 回帰統計

指標
重相関 R0.8809
重決定 R²0.7759
補正 R²0.7737
標準誤差197.81
観測数(n)500

■ 分散分析(ANOVA)

分類自由度変動分散F値有意確率(P値)
回帰566,940,710.3413,388,142.07342.147.03 × 10⁻¹⁵⁸
残差49419,330,436.8139,130.44
合計49986,271,147.16

■ 回帰係数と統計量

説明変数係数標準誤差t値P値95%信頼区間(下限)95%信頼区間(上限)
切片(定数)989.1140.3524.512.02 × 10⁻⁸⁷909.831068.38
area_sqm(面積)7.910.3721.363.58 × 10⁻⁷²7.198.64
rooms(部屋数)157.996.0426.152.91 × 10⁻⁹⁵146.12169.86
age_years(築年数)-11.370.66-17.327.35 × 10⁻⁵³-12.65-10.08
station_distance_min(駅距離)-24.531.31-18.692.30 × 10⁻⁵⁹-27.11-21.96
floor(階数)14.892.226.715.50 × 10⁻¹¹10.5319.26

📊 概要(回帰統計)

一番重要な数値たち:

  • 重相関R:0.8809
    • 実測値と予測値の相関関係(0〜1の範囲)
    • 0.8以上なら「良好」
  • 重決定R²:0.7759
    • **「このモデルは価格の変動を77.6%説明できる」**という意味
    • 0.7以上なら実用的
ルミィ
ルミィ

「決定係数77.6%って高いの?低いの?」って気になるよね。実はこれ、かなり優秀な数字なんだよ。

ルミィ
ルミィ

現実のデータで80%を超えることは珍しくて、60%でも実用レベル。逆に100%だと「データを丸暗記しただけ」の過学習を疑った方がいいくらいなんだ。今回の結果は十分信頼できる範囲だね。

  • 補正R²:0.7737
    • 変数の数を考慮した決定係数
    • R²とほぼ同じなら過剰適合の心配なし
  • 標準誤差:197.81(万円)
    • 平均的な予測誤差
    • 「大体±200万円の範囲で予測できる」という意味

📈 分散分析表(ANOVA)

  • 有意F:7.03E-158(ほぼゼロ)
    • モデル全体が統計的に意味があることを示す
    • 0.05未満なら合格

🔍 係数表(最も重要!)

各変数が価格に与える影響:

変数係数意味P値
面積+の数値1㎡増えると価格上昇< 0.05
部屋数+の数値1部屋増えると価格上昇< 0.05
築年数-の数値1年古いと価格下落< 0.05
駅距離-の数値駅から1分遠いと価格下落< 0.05
階数+の数値1階高いと価格上昇< 0.05

P値が0.05未満なら、その変数の影響は「統計的に有意」(偶然ではない)と言えます。

ルミィ
ルミィ

「P値ってよく聞くけど何…?」ってなるよね。簡単に言うと「この結果が偶然で出る確率」のこと。だから小さいほど信頼できるんだ。

ルミィ
ルミィ

一般的には0.05(5%)未満なら「偶然じゃなくて、本当に意味のある関係がある」と判断するよ。もっと厳しく見たいときは0.01を使うこともあるね。今回はほぼゼロだから、かなり信頼度の高い結果ってことになるよ。

ルミィ
ルミィ

ここまでお疲れさま!自分で回帰分析できると、ちょっと感動するよね。「もっと色んな分析手法を試してみたい!」って思ったら、下の本がおすすめだよ。今日と同じExcel画面ベースで機械学習の基礎をひと通り体験できるから、独学の次の1冊にぴったりなんだ。

📚 独学で機械学習の世界に踏み込みたい人へ
線形回帰の次のステップ(重回帰・決定木・クラスタリングなど)を、Excelの画面付きで体験できる入門書。プログラミング知識ゼロでもOKなのが嬉しいポイントだよ。

📝 結果の解釈

今回の分析結果から分かったこと:

✅ モデルの精度

  • 決定係数77.6% → かなり良好な予測精度
  • 標準誤差±197万円 → 許容範囲内

✅ 価格に影響する要因

  1. 面積・部屋数・階数 → プラス影響
  2. 築年数・駅距離 → マイナス影響

これらは直感的にも納得できる結果ですね!

ルミィ
ルミィ

平均価格が約1,700万円だから、誤差200万円なら十分実用範囲だよ。「これくらいの精度で予測できれば実務に使える」って判断する目安として覚えておこう。

ルミィ
ルミィ

今回はあえて前処理をしてないから、外れ値に近いデータも混ざっていたかもしれない。そういうイレギュラーを除いたり、変数を増やして重回帰分析にしたりすると、さらに精度を上げることができるよ。

💡 実務での活用例

この分析結果を使って:

  • 不動産投資:適正価格の判断材料に
  • 売却時期の検討:築年数による価格下落の予測
  • 物件選び:コスパの良い条件の発見
ルミィ
ルミィ

「これで不動産投資で儲けられる!」って思っちゃうかもしれないけど、ちょっと待ってね。

ルミィ
ルミィ

あくまでこれは「傾向」を示すもので、立地の細かい条件、市場の変化、経済情勢など、モデルに含まれない要因もたくさんあるよ。あくまで判断材料の一つとして、慎重に活用してね。

ルミィ
ルミィ

不動産投資や物件選びにデータ分析を活かしたいなら、Excelで使える分析手法をもう少し広く押さえておくと選択肢が広がるよ。下の本は、線形回帰だけじゃなくて他の機械学習手法もExcelで試せる内容になっているから、実務に応用しやすいんだ。

🏠 データに基づいた不動産判断をしたい人へ
感覚だけの判断から一歩抜け出すための、Excelで学ぶ機械学習の入門書。住宅価格分析の発展形(重回帰・分類・予測)まで体験できるから、今回の続編として相性ばっちりだよ。

🏠 不動産・住宅業界での実践活用例【重回帰分析への発展】

ここまでは「面積から価格を予測する」という単回帰分析(変数1つ)を扱ってきたよ。でも実務では、もっと多くの要因を組み合わせて精度を上げる「重回帰分析」がよく使われるんだ。

重回帰分析への発展ステップ

単回帰:価格 = a × 面積 + b
重回帰:価格 = a × 面積 + b × 部屋数 + c × 築年数 + d × 駅距離 + e

Excelでも分析ツールで全く同じ手順で実行可能。「入力X範囲」に複数列を選択するだけで重回帰分析になるよ。今回のサンプルデータなら、面積・部屋数・治安スコアを同時に入れて分析してみると、決定係数が単回帰より高くなるはずだよ。

不動産業界での具体的な活用シーン

1. 不動産査定への応用
不動産仲介業者が物件査定をする際、過去の取引事例から重回帰分析で「適正価格」を算出する手法は実務で広く使われているよ。Excelだけでも、町丁目単位の取引データがあれば自社査定モデルが作れるんだ。

2. 中古住宅の価格交渉材料
売主・買主どちらの立場でも、複数の類似物件データから重回帰モデルを作ると「この物件はモデル予測より◯◯万円高い/安い」と数値で示せる。感覚ではなく根拠を持った価格交渉ができるんだ。

3. 賃貸物件の家賃設定
家賃 = a × 面積 + b × 駅距離 + c × 築年数 + d × 階数 + e のような式で、所有物件の適正家賃を算出できるよ。空室期間の短縮にも繋がる実用的な手法だね。

4. 投資判断の客観化
不動産投資では「立地が良いから」「築浅だから」と感覚で判断しがちだけど、重回帰分析を使うと「このエリアの平均より◯%割安」と数値化できる。複数候補を客観比較できるのが強みだよ。

単回帰から重回帰へ:押さえておきたい3つの注意点

① 多重共線性(マルチコ)に注意
面積と部屋数のように、強く相関する変数同士を同時に入れると、係数が不安定になる現象が起きるよ。VIF値が10を超えたら要注意。

② サンプル数は変数の10倍以上
重回帰では「変数の数 × 10件以上のデータ」が一つの目安。変数5つなら最低50件、できれば100件以上のデータを集めよう。

③ 標準偏回帰係数で重要度を比較
変数によって単位が違う(面積は㎡、駅距離はm)から、係数の大きさだけでは重要度を比較できないんだ。「標準偏回帰係数」を見ることで「どの要因が一番効いているか」が分かるよ。

よくある質問(FAQ)

Q1. ExcelとPython、どちらで線形回帰分析をすべき?

データ量が数百〜数千件で、報告書やプレゼンに使う「分析」ならExcelで十分だよ。一方、数万件以上のデータを扱ったり、定期的に自動実行したいならPythonがおすすめ。最初はExcelで原理を体感して、必要になったらPythonに移るのが王道のステップアップだよ。

Q2. 決定係数(R²)はいくつあれば信頼できる?

分野によって基準は違うけど、ビジネス分野なら0.6以上で実用的、0.7以上で良好、0.8以上で優秀というのが一般的な目安。逆に1.0に近すぎる場合は過学習を疑った方がいいよ。今回の0.776(77.6%)は十分実用レベルだね。

Q3. P値が0.05より大きいと、その変数は使えない?

「統計的に意味がある関係とは言い切れない」というだけで、絶対に使えないわけじゃないよ。サンプル数が少ない場合や、業務上重要な変数なら、P値が0.1程度でも参考情報として使うこともある。ただし論文や正式な報告書では0.05が一つの基準になるよ。

Q4. 住宅価格以外にも応用できる?

もちろん!線形回帰分析は売上予測、広告効果測定、需要予測、品質管理、医療データ分析など、ほぼあらゆる分野で使えるよ。「ある数値を別の数値で予測したい」という場面では、まず線形回帰を試すのが鉄則だね。

Q5. 重回帰分析と線形回帰分析の違いは?

線形回帰の中で、説明変数(予測に使う変数)が1つのものを「単回帰」、2つ以上のものを「重回帰」と呼ぶよ。どちらも「直線的な関係を見つける」という意味で線形回帰の一種。実務では重回帰の方が圧倒的によく使われるよ。

Q6. データが少ないと精度はどうなる?

線形回帰では、最低でも変数の10倍以上のサンプル数が欲しいよ。例えば変数3つなら30件以上、できれば50件以上が望ましい。データが少ないと「たまたま当てはまった」だけの可能性が高くなって、新しいデータには使えない(汎化性能が低い)モデルになっちゃうんだ。

まとめ

Excelの「分析ツール」を使えば、プログラミング不要で本格的な統計分析ができます。

今回学んだポイント:

  • Excelだけで線形回帰分析は可能
  • 決定係数とP値の見方が重要
  • 結果の解釈は常識と照らし合わせる

次のステップ:

  • 他のデータでも試してみる
  • より多くの変数を追加して分析
  • 残差グラフで予測精度をチェック

統計分析の第一歩として、ぜひExcelの回帰分析を活用してみてください!


ルミィ
ルミィ

Excelで基礎をつかんだら、次はもっと色んな手法に挑戦したくない?この本は、Excelをそのまま使って機械学習の代表的な手法を体験できる構成だから、PythonやRに進む前のステップとしてもちょうどいいんだ。次の一手に迷ってる人にはピッタリだよ。

🚀 次のステップに進みたい人へ
「Excelで基礎は分かった、でも次は何を学べばいい?」という人に。線形回帰の先にある分析手法をExcelで体験できるから、Python移行前の橋渡しとしても優秀な1冊だよ。

この記事が役に立ったら、ぜひ実際のデータで試してみてくださいね。質問があれば、コメント欄でお気軽にどうぞ!

ルミィ
ルミィ
AIナビゲーター
ChatGPTにハマってから毎日AIを触り続けるブログ運営者。最新AIツールを初心者目線で発信しています。YouTubeでも解説動画を投稿中!
記事URLをコピーしました