AIの最新情報・実演を動画でチェック

*当ブログではアフィリエイト広告を利用しています。

平均・中央値・最頻値とは?違いと使い分けをやさしく図解

平均・中央値・最頻値とは?違いと使い分けをやさしく図解
ルミィ

「平均年収◯◯万円」——よく見る数字ですが、これを鵜呑みにすると、実態を大きく見誤ることがあります。なぜなら、データの“真ん中”を表す方法は、平均だけではないからです。

データの中心を1つの数字で表す値を代表値といい、代表的なものが平均・中央値・最頻値の3つです。この3つは、似ているようでいて、得意な場面も弱点もまるで違います。連載第2回では、その違いと“使い分け”を、図でやさしく見ていきましょう。

この連載は、統計のきほん(標準偏差・正規分布・相関・検定)の“ひとつ手前”——集めたデータをまず「要約して・見る」ための記述統計をあつかいます。

📏 連載「データの見方・まとめ方」(記述統計編・全4回)

集めたデータを「どう要約し、どう見るか」——データ分析の“いちばん最初の一歩”を、図でやさしく整理する連載です。

  1. データの種類|量的データと質的データ
  2. 平均・中央値・最頻値(この記事)|データの“真ん中”の測り方
  3. ヒストグラム|分布のかたちを見る
  4. 箱ひげ図|四分位数で外れ値を見抜く
ルミィ
ルミィ

「真ん中」と言っても3種類。どれを使うかで、データの印象がガラッと変わるんだ。とくに平均はクセが強いよ。

平均・中央値・最頻値の図解。左右対称なデータでは3つが一致し、右に歪んだデータ(外れ値あり)では平均が外れ値に引っぱられ、中央値・最頻値とズレることを示すヒストグラム。
図:左右対称なら3つは一致。でも歪み(外れ値)があると平均は引っぱられ、中央値・最頻値とズレます。

代表値とは?|3つの「真ん中」

代表値は、たくさんのデータを「だいたいこのあたり」と1つの数字で代表させたものです。よく使う3つを、まず整理しましょう。

  • 平均(へいきん)——すべて足して、個数で割った値。いちばん有名
  • 中央値(ちゅうおうち)——小さい順に並べたとき、ちょうど真ん中にくる値
  • 最頻値(さいひんち)——いちばん多く出てくる値

図を見てください。データが左右対称なら、この3つはほぼ同じ場所にきます。でも、データが歪んでいたり外れ値があったりすると、3つはバラバラの場所にズレるのです。

平均|全部を足して割る(でも外れ値に弱い)

平均は、すべての値を足して個数で割った、いちばんなじみのある代表値です。データ全体を使うので情報をムダなく活かせますが、大きな弱点があります。外れ値(極端な値)にとても弱いのです。

たとえば、5人の年収が「300・350・400・450・500(万円)」なら平均400万円で、実感どおり。でも、ここに1人だけ年収1億円の人が加わると、平均は約1992万円に跳ね上がります。6人のうち5人は500万円以下なのに、「平均約2000万円」では、まるで実態を表していません。これが、平均のワナです。

中央値|並べた“真ん中”(外れ値に強い)

中央値は、データを小さい順に並べて、ちょうど真ん中にくる値です(偶数個なら真ん中2つの平均)。

さきほどの「1人だけ1億円」の例でも、中央値は約425万円。極端な値が1つ増えても、真ん中の順位はほとんど動かないので、外れ値に引っぱられません。だから、年収・地価・世帯資産のように“一部の極端な値”を含むデータでは、平均より中央値のほうが実態をよく表します。「平均年収」より「中央値」を見るべき、と言われるのはこのためです。ニュースで『平均』と『中央値』が併記されているのを見かけたら、ぜひその差に注目してみてください。差が大きいほど、そのデータは一部の大きな値に引っぱられている、というサインなのです。

平均は全データを使うが外れ値に弱い。中央値は順位の真ん中なので外れ値に強い。歪んだデータでは中央値が頼りになる。

最頻値|いちばん多い値(カテゴリにも使える)

最頻値は、いちばん多く登場する値です。3つの中でいちばん地味ですが、独自の強みがあります。

それは、質的データ(カテゴリ)にも使えること。前回見たように、名義データ(血液型など)には平均も中央値も使えませんが、「いちばん多いのはA型」のように最頻値なら出せます。「人気No.1の商品」「いちばん多い回答」など、“最多”が知りたいときに活躍します。

どれを使う?|使い分けの早見表

3つの代表値は、データの性質や目的で使い分けます。

場面おすすめ理由
左右対称で外れ値がない平均全データを活かせる
外れ値・歪みがある(年収など)中央値極端な値に強い
カテゴリ・最多が知りたい最頻値質的データにも使える

迷ったら、平均と中央値の両方を出して比べるのがおすすめです。2つが大きくズレていたら、「外れ値や歪みがあるぞ」というサイン。データの形をうかがう手がかりになります。この『2つを並べて比べる』というひと工夫が、難しい計算をしなくても、データの歪みやクセを見抜く近道になります。

Excelで計算する

3つの代表値は、Excelの関数で簡単に出せます。

  • 平均——=AVERAGE(範囲)
  • 中央値——=MEDIAN(範囲)
  • 最頻値——=MODE.SNGL(範囲)(いちばん多い1つ)

まずはこの3つを並べて出し、見比べてみてください。3つの数字の“ズレ方”から、そのデータがどんな形をしているかが見えてきます。

具体例で計算してみる|7人のテスト

実際に3つを計算してみましょう。7人のテストの点数が 40, 50, 50, 60, 70, 80, 90 だったとします(小さい順に並べ済み)。

  • 平均——全部を足して7で割る:440 ÷ 7 = 約62.9点
  • 中央値——真ん中(4番目)の値:60点
  • 最頻値——いちばん多い値:2回出てくる50点

同じデータなのに、62.9点・60点・50点と、3つの“真ん中”がぜんぶ違いますね。どれが正しいというわけではなく、「何を真ん中とみなすか」が違うだけ。この感覚をつかんでおくと、代表値にだまされにくくなります。

「平均」が独り歩きする例

代表値の中でも、平均はとくに“独り歩き”しやすい数字です。ニュースでよく聞く平均値には、注意が必要なものがあります。

  • 平均貯蓄額——一部の富裕層が平均を押し上げ、「多くの人の実感」とズレる。中央値のほうが実態に近い
  • 平均年収——同上。高所得者に引っぱられて高めに出る
  • 平均寿命——「いま何歳まで生きるか」とは少し違う指標(生まれた年の平均余命)

どれも「平均」という言葉の印象が、実態より強く伝わってしまう例です。平均値を見たら、『これは外れ値に引っぱられていないか? 中央値はどうか?』と一呼吸おく——それだけで、数字の受け取り方が一段かしこくなります。

平均の仲間|加重平均

ふつうの平均は、すべてのデータを“平等”に扱います。でも、「重要なものを重く見たい」ときには、加重平均を使います。

これは、それぞれに“重み”をつけて平均する方法です。たとえば成績を「テスト7割・課題3割」で評価するなら、テストの点を0.7倍、課題の点を0.3倍して足し合わせます。商品の評価をまとめるとき「件数の多い店ほど重く見る」のも加重平均です。

じつは、ふつうの平均も「すべての重みが等しい加重平均」と言えます。ExcelではSUMPRODUCT関数などで計算できます。“平等に扱う”か“重みをつける”か——目的に応じて選べると、平均の使い方がぐっと広がります。身近なところでは、学校の成績(評定)や、複数の調査結果をまとめるときなどに、この加重平均が活躍しています。「ただの平均」と思っていたものが、実は重みつきだった、というケースは意外と多いのです。

代表値だけでは足りない|ばらつきも見る

真ん中(代表値)が分かっても、それだけではデータの姿は“半分”しか見えていません。残りの半分が、ばらつき(散らばり)です。

たとえば、平均60点のクラスが2つあったとします。一方は55〜65点に固まり、もう一方は20〜100点まで散らばっている。平均は同じ60点でも、中身はまったくの別物です。代表値(真ん中)だけ見て「同じようなクラスだ」と判断すると、大事な違いを見落としてしまいます。

だから、代表値と一緒に「どれくらい散らばっているか」も見るのが鉄則。**「真ん中(代表値)」+「散らばり(標準偏差や四分位)」の2点セット**が、データ要約の基本形です。このばらつきの測り方は、次の連載「統計のきほん」の標準偏差でくわしく扱います。

まとめ

データの“真ん中”を表す代表値には、平均・中央値・最頻値の3つがあります。平均は全データを使うが外れ値に弱く、中央値は順位の真ん中なので外れ値に強く、最頻値は最多の値でカテゴリにも使えます。

左右対称なら3つはほぼ一致しますが、歪みや外れ値があるとバラバラにズレます。だから「平均年収」のような数字は鵜呑みにせず、中央値もあわせて見る。代表値を使い分けられると、データにだまされにくくなります。次回は、その“データの形”を目で見るためのヒストグラムに進みます。

「平均」は便利な一方で、いちばん誤解を生みやすい数字でもあります。世の中の“平均◯◯”という見出しを目にしたとき、『これは外れ値に引っぱられていないか?』と立ち止まれるかどうか。たったそれだけで、数字に踊らされる人と、数字を冷静に読める人の差がつきます。代表値の使い分けは、統計を学ぶ最初の“だまされない力”なのです。平均・中央値・最頻値という3つの“真ん中”を自在に使い分けられるようになれば、ニュースの統計も、仕事のデータも、ぐっと正しく読めるようになります。まずは手元のデータで、AVERAGEとMEDIANを並べて出し、その差を眺めてみてください。そこから、データの“本当の真ん中”が見えてきます。

代表値=データの真ん中を表す値(平均・中央値・最頻値)。

平均は外れ値に弱い/中央値は強い/最頻値はカテゴリにも使える。

歪んだデータは中央値が頼り。平均と中央値を見比べると形が分かる。

よくある質問(FAQ)

平均・中央値・最頻値の違いは何ですか?

A. 平均はすべて足して個数で割った値、中央値は小さい順に並べた真ん中の値、最頻値はいちばん多く出てくる値です。データが左右対称ならほぼ一致しますが、歪みや外れ値があるとバラバラにズレます。

なぜ平均は外れ値に弱いのですか?

A. 平均はすべての値を足すため、極端に大きい(小さい)値が1つあるだけで全体が引っぱられるからです。たとえば5人の年収に1人だけ1億円の人が混じると、平均は跳ね上がり、実態を表さなくなります。

平均年収より中央値を見たほうがよいのはなぜですか?

A. 年収のデータは一部の高所得者で右に歪むため、平均が実態より高く出やすいからです。中央値は順位の真ん中なので極端な値に引っぱられず、『ちょうど真ん中の人の年収』という実感に近い値を示します。

最頻値はどんなときに使いますか?

A. いちばん多い値・最多の回答を知りたいときに使います。最大の特徴は、血液型や商品カテゴリのような質的データ(平均や中央値が使えないデータ)にも使えることです。『人気No.1』を知りたいときなどに役立ちます。

3つのうちどれを使えばいいですか?

A. 左右対称で外れ値がなければ平均、年収のように外れ値や歪みがあれば中央値、カテゴリや最多を知りたいなら最頻値が向きます。迷ったら平均と中央値の両方を出し、ズレ具合からデータの歪みを確認するのがおすすめです。

平均と中央値が大きく違うとき、何が分かりますか?

A. データに外れ値や歪みがあるサインです。平均が中央値より大きければ右に歪んでいる(高い側に裾を引く)、小さければ左に歪んでいると分かります。2つを見比べるだけで、データの形のクセに気づけます。

Excelで代表値はどう計算しますか?

A. 平均はAVERAGE関数、中央値はMEDIAN関数、最頻値はMODE.SNGL関数で計算できます。3つを並べて出して見比べると、データの分布の形(ズレ方)が見えてきます。

あわせて読みたい

参考・一次ソース

※本記事は2026年6月時点の一般的な統計の考え方を初心者向けに整理したものです。Excelの機能名やボタン位置はバージョンにより異なる場合があります。

ルミィ
ルミィ
AIナビゲーター
ChatGPT・Gemini・Claudeなどの会話AI、画像生成AI、動画生成AI、資料作成AI、AI検索ツールを初心者向けに解説するAIナビゲーター。実際に使ってみた感想や、仕事・学習・発信に役立つAI活用法をわかりやすく紹介しています。
記事URLをコピーしました