AIの最新情報・実演を動画でチェック

*当ブログではアフィリエイト広告を利用しています。

データ分析・機械学習

正規分布とは?釣り鐘型と68-95-99.7の法則をやさしく図解

正規分布とは?釣り鐘型と68-95-99.7の法則をやさしく図解
ルミィ

前回の標準偏差に続いて、統計でいちばん大事な分布——正規分布を見ていきます。テストの点数、身長、製品の誤差…**自然界や社会のあちこちに、この“釣り鐘型”は現れます**。

正規分布が分かると、「偏差値の正体」も「なぜ平均±3σが特別なのか」も、すっきり理解できます。数式は使わず、図でそのカタチと意味をつかんでいきましょう。

統計のきほんは、回帰分析やデータ分析を正しく使うための土台です。この連載を押さえておくと、回帰の結果も“なんとなく”ではなく“意味が分かって”読めるようになります。

📊 連載「統計のきほん」(全4回)

回帰分析やデータ分析の“土台”になる統計の基礎を、数式をできるだけ使わずに、図でやさしく整理する連載です。

  1. 標準偏差と分散|データのばらつきを測る
  2. 正規分布(この記事)|自然界に現れる釣り鐘型
  3. 相関|相関係数と「相関≠因果」
  4. 仮説検定・p値|偶然か、意味のある差か
ルミィ
ルミィ

中央が高くて、左右になだらか。この“釣り鐘型”が正規分布。統計のあちこちで主役になる、いちばん有名な形だよ。

正規分布の図解。左右対称の釣り鐘型の曲線に、平均±1σに約68%、±2σに約95%、±3σに約99.7%が収まることを示す色分けの領域。
図:平均±1σにデータの約68%、±2σに約95%、±3σに約99.7%が収まります(σ=標準偏差)。

正規分布とは?|釣り鐘型の分布

正規分布は、図のような左右対称の“釣り鐘型(ベルカーブ)”をした分布です。平均の近くにデータが多く集まり、平均から離れるほど少なくなる——この素直な形が特徴です。

身近な例で言えば、テストの点数。平均点あたりの人がいちばん多く、満点や0点に近い人ほど少なくなりますよね。身長、体重、製品の寸法誤差なども、多くがこの正規分布に近い形をしています。

平均と標準偏差で“形”が決まる

正規分布のうれしいところは、**たった2つの数字——平均と標準偏差——だけで、形が完全に決まる**ことです。

  • 平均——山の“中心がどこにあるか”を決める(左右の位置)
  • 標準偏差——山の“幅(広がり)”を決める。大きいほど、なだらかで横に広い山になる

つまり、平均と標準偏差さえ分かれば、そのデータがどんな釣り鐘型なのか、ぜんぶ言い当てられるのです。前回学んだ標準偏差が、ここで主役として効いてきます。

68-95-99.7の法則

正規分布には、覚えておくと一生使える有名な経験則があります。図の色分けがそれです。

  • 平均 ± 1標準偏差(±1σ)の範囲に、データの約68%が収まる
  • 平均 ± 2標準偏差(±2σ)の範囲に、約95%が収まる
  • 平均 ± 3標準偏差(±3σ)の範囲に、約99.7%が収まる

たとえば「平均60点・標準偏差10点」のテストなら、約95%の人が40〜80点(平均±2σ)に収まると分かります。逆に言えば、80点を超えるのは上位2.5%ほど。標準偏差いくつ分離れているかが分かれば、そのデータが“どれくらい珍しいか”まで見えてくるのです。

正規分布は平均と標準偏差だけで形が決まる。平均±1σに約68%、±2σに約95%、±3σに約99.7%が収まる。

偏差値の正体

受験でおなじみの偏差値。実はこれ、正規分布と標準偏差から作られています。

偏差値とは、平均を50・標準偏差を10に“ものさしを揃えた”値です。自分の点数が平均から標準偏差いくつ分離れているかをもとに計算します。だから偏差値60は「平均より1σ上=上位16%くらい」、偏差値70は「平均より2σ上=上位2.3%くらい」を意味します。テストの難易度が違っても比べられるのは、この“ものさし揃え”のおかげなのです。逆に、平均点や受験者のレベルがまるで違うテストでも、偏差値なら「全体の中での位置」として同じ土俵で比較できる——これが偏差値の便利さの正体です。

なぜこんなに登場するの?

「どうして、いろんなものが正規分布になるの?」——その答えのカギが中心極限定理です。少し難しい名前ですが、言いたいことはシンプルです。

「たくさんの小さな偶然が積み重なった結果は、正規分布に近づく」。たとえば身長は、無数の遺伝や栄養などの要因が少しずつ足し合わさった結果です。こうした“たくさんの要因の合計”は、自然と釣り鐘型になっていく——だから世の中に正規分布があふれているのです。この性質のおかげで、統計の多くの手法は「正規分布」を土台にして作られています。

正規分布じゃないときもある

便利な正規分布ですが、何でもかんでも正規分布、ではありません。注意も必要です。

  • 左右が偏る(歪み)——年収などは、一部の高額所得者がいて右に裾を引く(正規分布ではない)
  • 外れ値がある——極端な値があると、平均も標準偏差も引っ張られる
  • そもそも別の形——待ち時間や故障間隔など、正規分布に従わないデータも多い

分析の前に、まずヒストグラム(度数分布のグラフ)を描いて、本当に釣り鐘型かを目で確かめること。これが、統計でだまされないための大事な習慣です。

標準正規分布とz得点

正規分布を扱いやすくする、便利な“変換”があります。平均を0・標準偏差を1にそろえた正規分布を、標準正規分布と呼びます。

どんな正規分布も、この形に変換できます。そのとき各データは、「平均から標準偏差いくつ分離れているか」を表す数字(z得点)になります。z=2なら「平均より2σ上」。z得点に直すと、平均や単位が違うデータどうしでも、“珍しさ”を同じものさしで比べられます。前回の偏差値も、このz得点を「平均50・標準偏差10」に置き換えたものでした。

実例で考える|3σと品質管理

68-95-99.7の法則は、ものづくりの現場で大活躍します。たとえば、ある部品の長さが「平均10cm・標準偏差0.1cm」の正規分布だとします。

このとき、ほぼすべて(99.7%)の部品が、9.7〜10.3cm(平均±3σ)に収まるはず。もし、この範囲を外れた部品が頻繁に出るなら、「製造の何かがおかしい」とすぐ気づけます。これが、製造業で使われる「3σ(スリーシグマ)」という品質管理の考え方です。正規分布と標準偏差が、現場の“異常の早期発見”を支えているのです。

テストの点数で読み解く

もう一つ、身近な例で68-95-99.7の法則を使ってみましょう。「平均60点・標準偏差10点」の正規分布に近いテストを考えます。

  • 50〜70点(平均±1σ)——ここに全体の約68%。いわゆる“ふつう”のゾーン
  • 40〜80点(平均±2σ)——ここに約95%。80点超えは上位2.5%ほどの“優秀”
  • 30〜90点(平均±3σ)——ここに約99.7%。90点超えは、ほんの一握り

自分の点数が「平均から標準偏差いくつ分か」を考えるだけで、全体の中での位置(どれくらい上位か)がぱっと見えてきます。これこそ、偏差値が伝えようとしている情報そのものです。

正規分布は“便利な仮定”|過信は禁物

正規分布は強力ですが、それは「データが正規分布に従っている」ときの話です。実際のデータがそうでないのに、正規分布を前提にした計算をすると、答えがズレてしまいます。

たとえば、世帯年収を「平均±2σで95%」と考えると、現実とは大きく食い違います(年収は右に裾を引く分布だから)。「このデータは本当に釣り鐘型か?」をヒストグラムで確かめてから、正規分布の道具を使う。この一手間が、統計を“正しく”使う人と“なんとなく”使う人の分かれ道になります。

サイコロで体感する中心極限定理

「たくさんの偶然が積み重なると正規分布になる」——これを、サイコロで体感してみましょう。サイコロ1個の目は、1〜6が同じくらいの確率で出るので、釣り鐘型ではありません(平らな分布です)。

ところが、サイコロを10個まとめて振って、その合計を記録する。これを何百回もくり返してヒストグラムにすると——合計の分布は、不思議と釣り鐘型(正規分布)に近づいていきます。1つ1つはバラバラでも、たくさん足し合わせると正規分布になる。これが中心極限定理の“体感”です。身長や測定誤差のように「無数の小さな要因の合計」でできるものが正規分布に近づくのは、まさにこの仕組みのおかげなのです。

まとめ

正規分布は、平均の近くにデータが集まる左右対称の“釣り鐘型”の分布です。平均と標準偏差の2つだけで形が決まり、±1σに約68%・±2σに約95%・±3σに約99.7%が収まる、という法則を持ちます。偏差値も、この正規分布と標準偏差から作られていました。

たくさんの偶然の積み重ねが正規分布に近づく(中心極限定理)ため、世の中にあふれています。ただし何でも正規分布とは限らないので、ヒストグラムで確かめる習慣も大切です。次回は、2つのデータの関係を見る“相関”に進みます。

正規分布は、統計の世界の“共通語”のような存在です。68-95-99.7の法則、偏差値、品質管理の3σ、そして次回以降の検定——どれもこの釣り鐘型を土台にしています。逆に言えば、正規分布のイメージがしっかり頭に入っていれば、統計のかなりの部分は“絵”で理解できるようになります。

『平均の近くが多くて、離れるほど少ない。±1σで約7割、±2σで約95%』——この感覚さえ持っておけば、ニュースで見る「偏差値」や「ばらつき」の話も、すっと腑に落ちるはずです。釣り鐘型のシルエットを、ぜひ目に焼きつけておいてください。この一つの形を理解しているかどうかで、この先の統計の見通しは大きく変わります。次回の相関、そして最終回の検定へと、土台ができたあなたなら、きっとスムーズに進めるはずです。

正規分布=平均の近くに集まる左右対称の釣り鐘型。平均と標準偏差だけで形が決まる。

±1σに約68%・±2σに約95%・±3σに約99.7%。偏差値もこれが土台。

中心極限定理で頻出。ただし何でも正規分布ではない(要ヒストグラム確認)。

よくある質問(FAQ)

正規分布とは何ですか?

A. 平均の近くにデータが多く集まり、平均から離れるほど少なくなる、左右対称の“釣り鐘型(ベルカーブ)”の分布です。テストの点数や身長、製品の誤差など、自然界や社会の多くのデータがこの形に近くなります。

正規分布の形は何で決まりますか?

A. 平均と標準偏差の2つだけで完全に決まります。平均が山の中心の位置を、標準偏差が山の幅(広がり)を決めます。標準偏差が大きいほど、なだらかで横に広い山になります。

68-95-99.7の法則とは何ですか?

A. 正規分布では、平均±1標準偏差の範囲に約68%、±2標準偏差に約95%、±3標準偏差に約99.7%のデータが収まる、という経験則です。標準偏差いくつ分離れているかで、そのデータの珍しさが分かります。

偏差値と正規分布の関係は?

A. 偏差値は、平均を50・標準偏差を10にものさしを揃えた値で、正規分布を前提に作られています。偏差値60は平均より1標準偏差上(上位約16%)、偏差値70は2標準偏差上(上位約2.3%)を意味します。

なぜ正規分布はあちこちに現れるのですか?

A. 中心極限定理という性質のためです。たくさんの小さな偶然(要因)が積み重なった結果は、正規分布に近づきます。身長のように多くの要因の合計でできるものは、自然と釣り鐘型になります。

どんなデータでも正規分布になりますか?

A. なりません。年収のように一部の高額層で右に裾を引くデータや、待ち時間・故障間隔など、正規分布に従わないものも多くあります。分析の前にヒストグラムを描いて、本当に釣り鐘型かを確かめることが大切です。

正規分布は何の役に立ちますか?

A. 品質管理(平均±3σを管理基準にする)や、多くの統計的検定の土台として使われます。データが正規分布に近いと分かれば、平均と標準偏差だけで「どれくらい珍しい値か」を見積もれます。

あわせて読みたい

参考・一次ソース

  • 総務省統計局「なるほど統計学園」(stat.go.jp
  • IBM「Normal distribution」(ibm.com

※本記事は2026年6月時点の一般的な統計の考え方を初心者向けに整理したものです。厳密な定義や検定の前提条件は専門書もご確認ください。

📏 その“前”の基礎も:集めたデータを「どう要約し、どう見るか」——データの種類・平均/中央値/最頻値・ヒストグラム・箱ひげ図といった記述統計の基本は、連載「データの見方・まとめ方」(記述統計編・全4回)で図解しています。

ルミィ
ルミィ
AIナビゲーター
ChatGPT・Gemini・Claudeなどの会話AI、画像生成AI、動画生成AI、資料作成AI、AI検索ツールを初心者向けに解説するAIナビゲーター。実際に使ってみた感想や、仕事・学習・発信に役立つAI活用法をわかりやすく紹介しています。
記事URLをコピーしました