2026.06.15 2026.07.11

信頼区間とは？95%信頼区間の正しい意味をやさしく図解

ルミィ

「内閣支持率は42%」——よくあるニュースですが、これは“ぴったり42%”という意味ではありません。本当は「だいたい39〜45%くらい」という“幅”の話。この“幅”で推定する考え方が、連載最終回の信頼区間です。

検定が「差があるか・ないか」を判定するのに対し、信頼区間は「真の値は、だいたいこの範囲にある」と幅で示す、検定と対になる“推定”の考え方。仮説検定とセットで知っておくと、統計の見え方がぐっと深まります。

この連載は、仮説検定・p値の“具体的な手法編”です。「帰無仮説・p値・有意水準」の考え方がまだの方は、先にそちらを読むとスッと入ってきます。

🧪 連載「統計的検定・推定の使い分け」（全4回）

「その差は偶然か、意味があるか」——代表的な検定（t検定・カイ二乗・分散分析）と、推定の区間（信頼区間）を、使い分けの視点で整理する連載です。

t検定｜2グループの平均の差
カイ二乗検定｜カテゴリ同士の関係
分散分析（ANOVA）｜3グループ以上の比較
信頼区間（この記事）｜推定値を“幅”で表す

ルミィ

『42%』みたいな1点の数字は、実は“幅”の真ん中だけ見ているんだ。本当は幅で考えるのが正解だよ。

信頼区間の図解。真の値（母平均）の縦線に対し、標本ごとに作った「標本平均±誤差」の区間を複数描き、ほとんどが真の値を含むが、たまに外す区間（約5%）もあることを示す。 — 図：標本ごとに「標本平均±誤差」の区間を作る。95%信頼区間なら、何度も作れば約95%の区間が真の値を含みます（赤はたまに外す例）。

Contents

信頼区間とは？｜点でなく“幅”で推定する

信頼区間は、推定したい本当の値（真の値）が、だいたいこの範囲にあるだろう、という“幅”のことです。

アンケートや調査では、全員を調べることはできず、一部（標本）から全体（母集団）を推測します。その推測には、必ず“誤差”がつきもの。だから「支持率は42%ぴったり」（点推定）と言い切るより、「42%、ただし誤差を考えると39〜45%くらい」（区間推定）と幅で示すほうが、ずっと誠実で正確なのです。

95%信頼区間の“正しい”意味

信頼区間でいちばん誤解されやすいのが、「95%信頼区間」の意味です。よくある誤解は「真の値が95%の確率でこの区間にある」ですが、これは厳密には正しくありません。

正しくは、「同じ調査を何度もくり返して区間を作れば、そのうち約95%の区間が、真の値を含む」という意味です。図を見てください。何本もの区間を引くと、ほとんどは真の値（緑の線）をまたいでいますが、たまに外す区間（赤）もあります。100回作れば、約95回は当たり、約5回は外す——これが95%信頼区間の本当の意味です。

95%信頼区間＝「同じ手順で区間を作り続ければ、約95%の区間が真の値を含む」。真の値が95%の確率でその区間にある、ではない。

仕組み｜標本平均 ± 誤差

信頼区間は、基本的に「標本平均 ± 誤差」という形で作ります。

この“誤差”の幅は、データのばらつき（標準偏差）と、集めたデータの数（標本サイズ）から計算されます。ざっくり95%信頼区間なら「標本平均 ± 約2×標準誤差」。正規分布の「±2σに約95%」の話が、ここでも効いています。

つまり信頼区間は、これまで学んだ「平均」「ばらつき」「正規分布」を組み合わせた応用なのです。点推定（標本平均）を中心に、誤差のぶん左右に広げたもの——それが信頼区間です。

区間の幅は何で決まる？

信頼区間は、狭いほど「精度の高い推定」です。では、何が幅を決めるのでしょう。

データの数（標本サイズ）——多いほど誤差が小さく、区間は狭くなる。たくさん調べるほど精度が上がる
データのばらつき——ばらつきが大きいほど、区間も広くなる
信頼度（95%か99%か）——より高い信頼度（99%）を求めるほど、区間は広くなる（確実を期すほど幅が要る）

「もっと精度よく知りたい」なら、サンプルを増やすのが王道。逆に、少ないデータで出した推定は、区間が広い＝不確かだ、ということが、信頼区間を見れば一目で分かります。

信頼区間と検定の関係

じつは、信頼区間と仮説検定は、コインの裏表のような関係です。

たとえば「2グループの差」の95%信頼区間を作ったとき、その区間が「0（差なし）」を含んでいなければ、5%水準で有意（差あり）と判断できます。逆に、区間が0をまたいでいれば「差があるとは言えない」。検定の“有意かどうか”が、信頼区間の“幅”からも読み取れるのです。だから近年は、p値だけでなく信頼区間もあわせて報告するのが推奨されています。

具体例｜支持率調査で考える

身近な例で、信頼区間のありがたみを感じてみましょう。ある調査で「内閣支持率42%、信頼区間は±3ポイント（95%）」と出たとします。

これは「真の支持率は、だいたい39〜45%のあたり」という意味。もし別の月に支持率が44%と出ても、区間が重なっていれば「本当に上がったとは言い切れない」——誤差の範囲かもしれないからです。「42%→44%、2ポイント上昇！」という見出しも、信頼区間を知っていれば「その差、誤差じゃない？」と冷静に受け止められます。点の数字だけでなく“幅”で見ることが、数字にだまされない目になるのです。

信頼区間の“あるある誤解”

信頼区間は便利な一方、誤解されやすい概念でもあります。代表的な勘違いを正しておきましょう。

「真の値が95%の確率でこの区間にある」——よくある誤解。正しくは「区間を作り続ければ約95%が真の値を含む」
「95%のデータがこの区間に入る」——これも別物。信頼区間は“データの範囲”ではなく“真の平均の推定の幅”
「区間が広い＝悪い調査」とは限らない——データが少なかったり、ばらつきが大きいと自然に広くなる。正直に不確かさを示しているとも言える

細かいようですが、ここを正しく理解しているかどうかで、統計リテラシーの“深さ”が分かれます。

実務での信頼区間

信頼区間は、研究やビジネスのあちこちで活躍します。

ABテスト——「BはAより、コンバージョン率が1〜5ポイント高い」のように、効果を幅で報告する
世論・市場調査——支持率や認知率を、誤差つきで示す
機械学習の評価——モデルの精度を「85%±2%」のように幅で示し、偶然の良し悪しと区別する

「1点の数字」より「幅のある推定」のほうが、ずっと多くの情報を伝えてくれます。信頼区間は、不確かさと正直に向き合うための、大人の道具なのです。

信頼区間と“予測区間”の違い

最後に、まぎらわしい用語を1つ整理しておきます。信頼区間と似た言葉に予測区間がありますが、別ものです。

信頼区間——“真の平均”がどのあたりにあるか、の幅。集団全体の平均についての推定
予測区間——“次に得られる1つのデータ”がどのあたりに来るか、の幅。個々の値についての予測

予測区間は「次の1人」を当てるので、信頼区間よりずっと幅が広くなります。「平均はかなり正確に分かっても、個々のばらつきは大きい」——だから両者は別もの。回帰分析の予測などで両方が出てくるので、“平均の幅”か“個々の幅”か、を意識して読み分けましょう。

【保存版】どの検定を使う？

連載の総まとめとして、代表的な検定・手法の使い分けを表に整理します。迷ったら、ここに戻ってきてください。

調べたいこと	データの種類	使う手法
2グループの平均の差	数値（量的）	t検定
3グループ以上の平均の差	数値（量的）	分散分析（ANOVA）
カテゴリ同士の関係	カテゴリ（質的）	カイ二乗検定
2つの数値の関係の強さ	数値（量的）	相関（相関係数）
真の値を“幅”で推定	数値（量的）	信頼区間

ポイントは、まず「データが数値か、カテゴリか」を見て、次に「何グループか・何を知りたいか」を考えること。この2つが決まれば、使う手法はほぼ自然に決まります。手法を丸暗記するより、この“選び方の地図”を持っておくほうが、ずっと実戦的です。そして、どの手法を使うにせよ、出てきた結果は「有意かどうか」だけでなく、効果量や信頼区間で“大きさ”まで見る——この姿勢が、全ての検定に共通する作法でした。

まとめ｜連載のおわりに

信頼区間は、真の値を1点ではなく“幅”で推定する考え方です。95%信頼区間は「真の値が95%の確率でこの区間にある」のではなく、「同じ手順で区間を作り続ければ、約95%が真の値を含む」という意味でした。標本平均±誤差で作り、データが多いほど幅は狭く（精度が高く）なります。

これで連載「統計的検定・推定の使い分け」は完結です。2群のt検定、カテゴリのカイ二乗検定、3群以上の分散分析、そして幅で示す信頼区間。「その差は偶然か、意味があるか」「真の値はどのあたりか」に、根拠をもって答えられる——これが、統計的検定・推定の力です。お疲れさまでした。

検定と推定は、統計のいわば“最終兵器”です。でも、その土台にあるのは、これまで学んできた平均・ばらつき・正規分布・確率という基本の積み重ね。難しい数式を覚える必要はありません。『その差は、ばらつきに比べて十分大きいか』『真の値は、どのくらいの幅で見るべきか』——この素直な問いを持ち続けることが、データに惑わされず、根拠をもって判断する力になります。

世の中は「平均が上がった」「◯◯と△△に関係が」「効果が出た」といった主張であふれています。そのとき、『それは偶然の範囲では？』『誤差を考えたらどう？』と一歩立ち止まれること。それこそが、この連載でいちばん持ち帰ってほしい“統計の目”です。手元のデータで、ぜひ一度、検定や信頼区間を試してみてください。

信頼区間＝真の値を“幅”で推定する。95%＝「作り続ければ約95%が真の値を含む」。

標本平均±誤差。データが多いほど幅は狭く（高精度）。

区間が“差なし(0)”を含まなければ有意。検定と裏表の関係。

よくある質問（FAQ）

信頼区間とは何ですか？

A. 推定したい本当の値（真の値）が、だいたいこの範囲にあるだろう、という“幅”のことです。一部のデータ（標本）から全体を推測するときの誤差を考え、「42%、ただし39〜45%くらい」のように幅で示します。

95%信頼区間の正しい意味は何ですか？

A. 「真の値が95%の確率でこの区間にある」は誤解です。正しくは「同じ手順で区間を何度も作れば、そのうち約95%の区間が真の値を含む」という意味です。100回作れば約95回当たり、約5回は外す、というイメージです。

信頼区間はどうやって作りますか？

A. 基本は「標本平均 ± 誤差」です。誤差の幅は、データのばらつき（標準偏差）と集めたデータの数から計算します。95%信頼区間ならおおよそ「標本平均 ± 約2×標準誤差」で、正規分布の±2σに約95%が入る性質を使っています。

信頼区間の幅は何で決まりますか？

A. データの数（多いほど狭い＝高精度）、データのばらつき（大きいほど広い）、信頼度（95%より99%のほうが広い）で決まります。精度よく推定したいなら、サンプルを増やすのが王道です。

点推定と区間推定の違いは何ですか？

A. 点推定は「支持率42%」のように1つの値で推定することです。区間推定は「39〜45%」のように幅で推定することです。推定には誤差がつきものなので、幅で示す区間推定のほうが誠実で、不確かさも伝わります。

信頼区間と仮説検定の関係は何ですか？

A. コインの裏表のような関係です。2グループの差の95%信頼区間が「0（差なし）」を含まなければ、5%水準で有意（差あり）と判断できます。検定の有意かどうかが、信頼区間の幅からも読み取れます。

信頼度を99%にすると区間はどうなりますか？

A. 区間は広くなります。より確実に真の値を含めようとするほど、幅を広くとる必要があるためです。95%と99%は、確実さと区間の狭さのトレードオフで選びます。