信頼区間とは?95%信頼区間の正しい意味をやさしく図解
「内閣支持率は42%」——よくあるニュースですが、これは“ぴったり42%”という意味ではありません。本当は「だいたい39〜45%くらい」という“幅”の話。この“幅”で推定する考え方が、連載最終回の信頼区間です。
検定が「差があるか・ないか」を判定するのに対し、信頼区間は「真の値は、だいたいこの範囲にある」と幅で示す、検定と対になる“推定”の考え方。仮説検定とセットで知っておくと、統計の見え方がぐっと深まります。
この連載は、仮説検定・p値の“具体的な手法編”です。「帰無仮説・p値・有意水準」の考え方がまだの方は、先にそちらを読むとスッと入ってきます。
🧪 連載「統計的検定・推定の使い分け」(全4回)
「その差は偶然か、意味があるか」——代表的な検定(t検定・カイ二乗・分散分析)と、推定の区間(信頼区間)を、使い分けの視点で整理する連載です。
- t検定|2グループの平均の差
- カイ二乗検定|カテゴリ同士の関係
- 分散分析(ANOVA)|3グループ以上の比較
- 信頼区間(この記事)|推定値を“幅”で表す

『42%』みたいな1点の数字は、実は“幅”の真ん中だけ見ているんだ。本当は幅で考えるのが正解だよ。

信頼区間とは?|点でなく“幅”で推定する
信頼区間は、推定したい本当の値(真の値)が、だいたいこの範囲にあるだろう、という“幅”のことです。
アンケートや調査では、全員を調べることはできず、一部(標本)から全体(母集団)を推測します。その推測には、必ず“誤差”がつきもの。だから「支持率は42%ぴったり」(点推定)と言い切るより、「42%、ただし誤差を考えると39〜45%くらい」(区間推定)と幅で示すほうが、ずっと誠実で正確なのです。
95%信頼区間の“正しい”意味
信頼区間でいちばん誤解されやすいのが、「95%信頼区間」の意味です。よくある誤解は「真の値が95%の確率でこの区間にある」ですが、これは厳密には正しくありません。
正しくは、「同じ調査を何度もくり返して区間を作れば、そのうち約95%の区間が、真の値を含む」という意味です。図を見てください。何本もの区間を引くと、ほとんどは真の値(緑の線)をまたいでいますが、たまに外す区間(赤)もあります。100回作れば、約95回は当たり、約5回は外す——これが95%信頼区間の本当の意味です。
95%信頼区間=「同じ手順で区間を作り続ければ、約95%の区間が真の値を含む」。真の値が95%の確率でその区間にある、ではない。
仕組み|標本平均 ± 誤差
信頼区間は、基本的に「標本平均 ± 誤差」という形で作ります。
この“誤差”の幅は、データのばらつき(標準偏差)と、集めたデータの数(標本サイズ)から計算されます。ざっくり95%信頼区間なら「標本平均 ± 約2×標準誤差」。正規分布の「±2σに約95%」の話が、ここでも効いています。
つまり信頼区間は、これまで学んだ「平均」「ばらつき」「正規分布」を組み合わせた応用なのです。点推定(標本平均)を中心に、誤差のぶん左右に広げたもの——それが信頼区間です。
区間の幅は何で決まる?
信頼区間は、狭いほど「精度の高い推定」です。では、何が幅を決めるのでしょう。
- データの数(標本サイズ)——多いほど誤差が小さく、区間は狭くなる。たくさん調べるほど精度が上がる
- データのばらつき——ばらつきが大きいほど、区間も広くなる
- 信頼度(95%か99%か)——より高い信頼度(99%)を求めるほど、区間は広くなる(確実を期すほど幅が要る)
「もっと精度よく知りたい」なら、サンプルを増やすのが王道。逆に、少ないデータで出した推定は、区間が広い=不確かだ、ということが、信頼区間を見れば一目で分かります。
信頼区間と検定の関係
じつは、信頼区間と仮説検定は、コインの裏表のような関係です。
たとえば「2グループの差」の95%信頼区間を作ったとき、その区間が「0(差なし)」を含んでいなければ、5%水準で有意(差あり)と判断できます。逆に、区間が0をまたいでいれば「差があるとは言えない」。検定の“有意かどうか”が、信頼区間の“幅”からも読み取れるのです。だから近年は、p値だけでなく信頼区間もあわせて報告するのが推奨されています。
具体例|支持率調査で考える
身近な例で、信頼区間のありがたみを感じてみましょう。ある調査で「内閣支持率42%、信頼区間は±3ポイント(95%)」と出たとします。
これは「真の支持率は、だいたい39〜45%のあたり」という意味。もし別の月に支持率が44%と出ても、区間が重なっていれば「本当に上がったとは言い切れない」——誤差の範囲かもしれないからです。「42%→44%、2ポイント上昇!」という見出しも、信頼区間を知っていれば「その差、誤差じゃない?」と冷静に受け止められます。点の数字だけでなく“幅”で見ることが、数字にだまされない目になるのです。
信頼区間の“あるある誤解”
信頼区間は便利な一方、誤解されやすい概念でもあります。代表的な勘違いを正しておきましょう。
- 「真の値が95%の確率でこの区間にある」——よくある誤解。正しくは「区間を作り続ければ約95%が真の値を含む」
- 「95%のデータがこの区間に入る」——これも別物。信頼区間は“データの範囲”ではなく“真の平均の推定の幅”
- 「区間が広い=悪い調査」とは限らない——データが少なかったり、ばらつきが大きいと自然に広くなる。正直に不確かさを示しているとも言える
細かいようですが、ここを正しく理解しているかどうかで、統計リテラシーの“深さ”が分かれます。
実務での信頼区間
信頼区間は、研究やビジネスのあちこちで活躍します。
- ABテスト——「BはAより、コンバージョン率が1〜5ポイント高い」のように、効果を幅で報告する
- 世論・市場調査——支持率や認知率を、誤差つきで示す
- 機械学習の評価——モデルの精度を「85%±2%」のように幅で示し、偶然の良し悪しと区別する
「1点の数字」より「幅のある推定」のほうが、ずっと多くの情報を伝えてくれます。信頼区間は、不確かさと正直に向き合うための、大人の道具なのです。
信頼区間と“予測区間”の違い
最後に、まぎらわしい用語を1つ整理しておきます。信頼区間と似た言葉に予測区間がありますが、別ものです。
- 信頼区間——“真の平均”がどのあたりにあるか、の幅。集団全体の平均についての推定
- 予測区間——“次に得られる1つのデータ”がどのあたりに来るか、の幅。個々の値についての予測
予測区間は「次の1人」を当てるので、信頼区間よりずっと幅が広くなります。「平均はかなり正確に分かっても、個々のばらつきは大きい」——だから両者は別もの。回帰分析の予測などで両方が出てくるので、“平均の幅”か“個々の幅”か、を意識して読み分けましょう。
【保存版】どの検定を使う?
連載の総まとめとして、代表的な検定・手法の使い分けを表に整理します。迷ったら、ここに戻ってきてください。
| 調べたいこと | データの種類 | 使う手法 |
|---|---|---|
| 2グループの平均の差 | 数値(量的) | t検定 |
| 3グループ以上の平均の差 | 数値(量的) | 分散分析(ANOVA) |
| カテゴリ同士の関係 | カテゴリ(質的) | カイ二乗検定 |
| 2つの数値の関係の強さ | 数値(量的) | 相関(相関係数) |
| 真の値を“幅”で推定 | 数値(量的) | 信頼区間 |
ポイントは、まず「データが数値か、カテゴリか」を見て、次に「何グループか・何を知りたいか」を考えること。この2つが決まれば、使う手法はほぼ自然に決まります。手法を丸暗記するより、この“選び方の地図”を持っておくほうが、ずっと実戦的です。そして、どの手法を使うにせよ、出てきた結果は「有意かどうか」だけでなく、効果量や信頼区間で“大きさ”まで見る——この姿勢が、全ての検定に共通する作法でした。
まとめ|連載のおわりに
信頼区間は、真の値を1点ではなく“幅”で推定する考え方です。95%信頼区間は「真の値が95%の確率でこの区間にある」のではなく、「同じ手順で区間を作り続ければ、約95%が真の値を含む」という意味でした。標本平均±誤差で作り、データが多いほど幅は狭く(精度が高く)なります。
これで連載「統計的検定・推定の使い分け」は完結です。2群のt検定、カテゴリのカイ二乗検定、3群以上の分散分析、そして幅で示す信頼区間。「その差は偶然か、意味があるか」「真の値はどのあたりか」に、根拠をもって答えられる——これが、統計的検定・推定の力です。お疲れさまでした。
検定と推定は、統計のいわば“最終兵器”です。でも、その土台にあるのは、これまで学んできた平均・ばらつき・正規分布・確率という基本の積み重ね。難しい数式を覚える必要はありません。『その差は、ばらつきに比べて十分大きいか』『真の値は、どのくらいの幅で見るべきか』——この素直な問いを持ち続けることが、データに惑わされず、根拠をもって判断する力になります。
世の中は「平均が上がった」「◯◯と△△に関係が」「効果が出た」といった主張であふれています。そのとき、『それは偶然の範囲では?』『誤差を考えたらどう?』と一歩立ち止まれること。それこそが、この連載でいちばん持ち帰ってほしい“統計の目”です。手元のデータで、ぜひ一度、検定や信頼区間を試してみてください。
信頼区間=真の値を“幅”で推定する。95%=「作り続ければ約95%が真の値を含む」。
標本平均±誤差。データが多いほど幅は狭く(高精度)。
区間が“差なし(0)”を含まなければ有意。検定と裏表の関係。
よくある質問(FAQ)
信頼区間とは何ですか?
A. 推定したい本当の値(真の値)が、だいたいこの範囲にあるだろう、という“幅”のことです。一部のデータ(標本)から全体を推測するときの誤差を考え、「42%、ただし39〜45%くらい」のように幅で示します。
95%信頼区間の正しい意味は何ですか?
A. 「真の値が95%の確率でこの区間にある」は誤解です。正しくは「同じ手順で区間を何度も作れば、そのうち約95%の区間が真の値を含む」という意味です。100回作れば約95回当たり、約5回は外す、というイメージです。
信頼区間はどうやって作りますか?
A. 基本は「標本平均 ± 誤差」です。誤差の幅は、データのばらつき(標準偏差)と集めたデータの数から計算します。95%信頼区間ならおおよそ「標本平均 ± 約2×標準誤差」で、正規分布の±2σに約95%が入る性質を使っています。
信頼区間の幅は何で決まりますか?
A. データの数(多いほど狭い=高精度)、データのばらつき(大きいほど広い)、信頼度(95%より99%のほうが広い)で決まります。精度よく推定したいなら、サンプルを増やすのが王道です。
点推定と区間推定の違いは何ですか?
A. 点推定は「支持率42%」のように1つの値で推定することです。区間推定は「39〜45%」のように幅で推定することです。推定には誤差がつきものなので、幅で示す区間推定のほうが誠実で、不確かさも伝わります。
信頼区間と仮説検定の関係は何ですか?
A. コインの裏表のような関係です。2グループの差の95%信頼区間が「0(差なし)」を含まなければ、5%水準で有意(差あり)と判断できます。検定の有意かどうかが、信頼区間の幅からも読み取れます。
信頼度を99%にすると区間はどうなりますか?
A. 区間は広くなります。より確実に真の値を含めようとするほど、幅を広くとる必要があるためです。95%と99%は、確実さと区間の狭さのトレードオフで選びます。
あわせて読みたい
参考・一次ソース
- IBM「What is a confidence interval?」(ibm.com)
- 総務省統計局「なるほど統計学園 高等部」(stat.go.jp)
※本記事は2026年6月時点の一般的な統計の考え方を初心者向けに整理したものです。検定の前提条件や厳密な手順は専門書もご確認ください。

