AIの最新情報・実演を動画でチェック

*当ブログではアフィリエイト広告を利用しています。

データ分析・機械学習

標準偏差とは?分散との違いとデータのばらつきをやさしく図解

標準偏差とは?分散との違いとデータのばらつきをやさしく図解
ルミィ

テストで「平均点は60点」と言われても、それだけでは中身が分かりません。みんなが55〜65点に固まっているのか、20点と100点がバラバラにいるのか——同じ平均でも、データの“散らばり方”はまるで違うからです。

この「ばらつき(散らばり)」を数字で表すのが、分散標準偏差です。統計でもっとも基本的で、もっとも使う道具のひとつ。連載「統計のきほん」の第1回として、まずはここを図でやさしく押さえましょう。

統計のきほんは、回帰分析やデータ分析を正しく使うための土台です。この連載を押さえておくと、回帰の結果も“なんとなく”ではなく“意味が分かって”読めるようになります。

📊 連載「統計のきほん」(全4回)

回帰分析やデータ分析の“土台”になる統計の基礎を、数式をできるだけ使わずに、図でやさしく整理する連載です。

  1. 標準偏差と分散(この記事)|データのばらつきを測る
  2. 正規分布|自然界に現れる釣り鐘型
  3. 相関|相関係数と「相関≠因果」
  4. 仮説検定・p値|偶然か、意味のある差か
ルミィ
ルミィ

平均は『真ん中』、標準偏差は『散らばり具合』。この2つがそろって、はじめてデータの姿が見えるんだ。

標準偏差の図解。同じ平均50のデータでも、データA(平均の近くに密集=ばらつき小)とデータB(広く散らばる=ばらつき大)で散らばり方が違うことを示すドットプロット。
図:平均が同じでも、標準偏差が大きいほどデータは広く散らばります。標準偏差は“平均からの距離のならし”です。

「平均」だけでは足りない

図を見てください。データAもデータBも、平均は同じ50点です。でも、見るからに様子が違います。

  • データA——みんなが平均(50点)の近くに固まっている。ばらつきが小さい
  • データB——20点台から70点近くまで、広く散らばっている。ばらつきが大きい

もし「平均50点」しか知らなければ、この2つを同じものとして扱ってしまいます。でも実際には、AとBはまったく違う集団です。この“散らばりの違い”を数字にするのが、分散と標準偏差の役割です。

分散とは?|ばらつきを“面積”で測る

分散は、ばらつきを表す代表的な数字です。考え方は3ステップです。

  1. ①偏差を出す——各データが平均から、どれだけ離れているか(=偏差)を計算する
  2. ②二乗する——その偏差を、それぞれ二乗する
  3. ③平均する——二乗した値の平均をとる。これが分散

つまり分散は、「平均からの距離(偏差)を二乗して、ならしたもの」。データが平均から遠くに散らばっているほど、分散は大きくなります。

標準偏差とは?|分散の“平方根”

分散には、ひとつ困ったところがあります。途中で二乗しているので、単位も二乗(点なら「点²」)になってしまい、元のデータと直接くらべにくいのです。

そこで、分散の平方根(ルート)をとって、単位を元に戻したもの標準偏差です。標準偏差なら「平均±10点くらいの幅で散らばっている」と、元の点数と同じ感覚で読めます。だから実務では、分散より標準偏差のほうがよく使われます。

分散=平均からの距離(偏差)を二乗してならしたもの。標準偏差=その平方根で、単位を元に戻したもの。どちらも“ばらつきの大きさ”を表す。

なぜ二乗するの?

「偏差をそのまま平均すればいいのでは?」と思うかもしれません。ところが、それではうまくいかないのです。

偏差には、平均より上(プラス)と下(マイナス)があります。そのまま足すと、プラスとマイナスが打ち消し合って、合計はいつもゼロになってしまいます。これではばらつきを測れません。そこで二乗してすべてプラスにしてから平均する——これが、分散が二乗を使う理由です。二乗には「大きく外れた値を、より強く反映させる」効果もあります。

標準偏差の使いどころ

標準偏差は、いろいろな場面で“ばらつきのものさし”として活躍します。

  • 品質管理——製品のサイズのばらつきを測り、安定して作れているかを管理する
  • テスト・評価——点数のばらつきを見る。偏差値も標準偏差から計算される
  • 投資・リスク——価格の変動の大きさ(リスク)を標準偏差で表す
  • 異常検知——「平均±3標準偏差」を超える値を、異常の候補とみなす

「平均」が中心を表すなら、「標準偏差」は広がりを表す。この2つはセットで使うのが基本です。平均だけ、標準偏差だけでは、データの本当の姿は見えてきません。中心と広がり、その両方をそろえて、はじめてデータを“立体的に”つかめるのです。

Excelで計算する

標準偏差や分散は、Excelの関数で一発で計算できます。少しだけ種類があるので、押さえておきましょう。

  • STDEV.P / VAR.P——手元のデータ“全体”そのものを対象にするとき(母集団)
  • STDEV.S / VAR.S——大きな集団から一部を抜き出した“標本”から、全体を推測するとき

迷ったら、アンケートやサンプル調査など「一部を抜き出したデータ」ならSTDEV.Sを使うのが基本です。=STDEV.S(範囲) と書くだけで、標準偏差が求まります。

具体例で計算してみる

実際に手を動かすと、ぐっと腑に落ちます。5人のテストの点数 50, 60, 70, 80, 90(平均70点)で、標準偏差を出してみましょう。

  1. ①偏差を出す——各点と平均70の差:-20, -10, 0, +10, +20
  2. ②二乗する——400, 100, 0, 100, 400
  3. ③平均する(分散)——合計1000 ÷ 5 = 200。これが分散
  4. ④平方根(標準偏差)——√200 ≒ 約14.1点

つまり、この5人は「平均70点を中心に、だいたい±14点くらいの幅で散らばっている」と読めます。やっていることは、「平均からどれだけ離れているか」を、二乗してならして、ルートで戻すだけ。この流れさえ追えれば、標準偏差はもう怖くありません。実際の計算はExcelや電卓がやってくれるので、大事なのは“何を計算しているか”のイメージを持っておくことです。

単位が違うものを比べる|変動係数

標準偏差には、ひとつ弱点があります。単位や規模が違うものを、そのまま比べられないのです。身長(cm)のばらつきと体重(kg)のばらつきを、標準偏差の数字だけで比較しても意味がありません。

そこで使うのが変動係数(CV)です。これは「標準偏差 ÷ 平均」で計算する“割合”のばらつき。単位が消えるので、規模や単位の違うデータどうしの“ばらつき具合”を公平に比べられます。「平均に対して、どれくらい散らばっているか」を見たいときに便利な指標です。

標準偏差を“直感”でつかむ

最後に、ざっくりした感覚を持っておきましょう。多くのデータでは、その大部分が「平均 ± 標準偏差1〜2個分」の範囲に収まります

実は次回くわしく見る正規分布では、「平均±標準偏差1個分」にデータの約68%が収まります。だから標準偏差は、「だいたいこれくらいの幅でばらつくよ」という、データの“振れ幅の目安”として使えるのです。

ばらつきが大事な理由|2つの工場の話

「平均が同じなら同じ」ではない——それを実感できる例を挙げましょう。2つの工場が、同じ部品を作っているとします。どちらも平均は10.0cm。でも、工場Aは標準偏差0.05cm(安定)、工場Bは標準偏差0.5cm(ばらつき大)だったら、どうでしょう。

平均だけ見れば「同じ品質」に見えます。でも実際は、ばらつきの大きい工場Bは、規格を外れた不良品をたくさん出してしまう。平均が同じでも、標準偏差が違えば品質はまったく別物なのです。「平均が良い」だけで安心せず、「ばらつきは小さいか」まで見る——これが、データを正しく評価する目線です。

投資にも通じる|平均はリターン、標準偏差はリスク

この考え方は、お金の世界でもそのまま使われています。2つの金融商品の期待リターン(平均)が同じでも、価格の変動(標準偏差)が大きいほうがハイリスクです。

「平均(期待されるリターン)」と「標準偏差(どれくらい上下に振れるか=リスク)」をセットで見る。これは投資判断の基本でもあります。分野は違っても、「真ん中」と「散らばり」をペアで見るという発想は、あらゆるデータ分析に共通する“ものの見方”なのです。

まとめ

分散と標準偏差は、データの“ばらつき(散らばり)”を表す統計の基本です。平均からの距離(偏差)を二乗してならしたものが分散、その平方根で単位を元に戻したものが標準偏差でした。

統計を学ぶと、たくさんの指標が出てきます。でも、いちばん最初に出会い、いちばん長く付き合うのが、この平均と標準偏差です。『真ん中はどこか(平均)』『どれくらい散らばっているか(標準偏差)』——この2つは、どんなデータに対しても、まず投げかけるべき基本の問いです。

次回学ぶ正規分布も、その先の相関も検定も、すべてこの『ばらつきを測る』という考え方の上に成り立っています。標準偏差は、統計という建物の“土台の一本目”。ここをしっかり踏みしめておけば、この先の話もずっと楽に登れます。まずは身近なデータで、ExcelのSTDEV.Sを一度使ってみてください。自分のデータの“平均”と“ばらつき”が数字で見えた瞬間、ぼんやりしていたデータが急にくっきりと姿を現します。その小さな発見の積み重ねが、統計を学び続ける原動力になります。次回は、この標準偏差が主役になる正規分布で、さらに視界が開けますよ。

同じ平均でも、ばらつきが違えばまったく別のデータ。だから「平均」と「標準偏差」はいつもセットで見ます。次回は、この標準偏差が主役として登場する、統計でいちばん大事な分布——正規分布に進みます。

分散=偏差を二乗してならしたばらつき。標準偏差=その平方根(単位が元に戻る)。

平均が同じでも、標準偏差が違えば別のデータ。

ExcelはSTDEV.S(標本)/ STDEV.P(母集団)。平均とセットで使う。

よくある質問(FAQ)

標準偏差とは何ですか?

A. データが平均からどれくらい散らばっているか(ばらつき)を表す数字です。分散の平方根をとって単位を元に戻したもので、「平均±10点くらいの幅で散らばっている」のように、元のデータと同じ感覚で読めます。

分散と標準偏差の違いは何ですか?

A. 分散は、平均からの距離(偏差)を二乗してならしたものです。標準偏差は、その分散の平方根をとったものです。分散は単位が二乗になって読みにくいため、単位を元に戻した標準偏差のほうが実務でよく使われます。

なぜ分散では偏差を二乗するのですか?

A. 偏差をそのまま足すと、平均より上(プラス)と下(マイナス)が打ち消し合って合計がゼロになり、ばらつきを測れないためです。二乗してすべてプラスにしてから平均します。大きな外れを強く反映する効果もあります。

平均だけではダメなのですか?

A. 平均は『真ん中』しか表さないため、同じ平均でも中身がまったく違うことがあります。みんなが平均近くに固まっているのか、広く散らばっているのかは、標準偏差を見ないと分かりません。平均と標準偏差はセットで使います。

標準偏差は何に使われますか?

A. 製品サイズのばらつきを見る品質管理、テストの偏差値の計算、価格変動の大きさ(リスク)の表現、平均±3標準偏差を超える値を異常とみなす異常検知などに使われます。

ExcelのSTDEV.SとSTDEV.Pの違いは何ですか?

A. STDEV.Pは手元のデータ全体そのものを対象にするとき(母集団)、STDEV.Sは大きな集団から一部を抜き出した標本から全体を推測するときに使います。アンケートやサンプル調査では基本的にSTDEV.Sを使います。

偏差値と標準偏差は関係ありますか?

A. あります。偏差値は、平均を50・標準偏差を10に変換した値です。自分の点数が平均から標準偏差いくつ分離れているかをもとに計算されるため、標準偏差が分かると偏差値の意味もよく理解できます。

あわせて読みたい

参考・一次ソース

※本記事は2026年6月時点の一般的な統計の考え方を初心者向けに整理したものです。厳密な定義や検定の前提条件は専門書もご確認ください。

📏 その“前”の基礎も:集めたデータを「どう要約し、どう見るか」——データの種類・平均/中央値/最頻値・ヒストグラム・箱ひげ図といった記述統計の基本は、連載「データの見方・まとめ方」(記述統計編・全4回)で図解しています。

ルミィ
ルミィ
AIナビゲーター
ChatGPT・Gemini・Claudeなどの会話AI、画像生成AI、動画生成AI、資料作成AI、AI検索ツールを初心者向けに解説するAIナビゲーター。実際に使ってみた感想や、仕事・学習・発信に役立つAI活用法をわかりやすく紹介しています。
記事URLをコピーしました