平均・中央値・最頻値とは?違いと使い分けをやさしく図解
「平均年収◯◯万円」——よく見る数字ですが、これを鵜呑みにすると、実態を大きく見誤ることがあります。なぜなら、データの“真ん中”を表す方法は、平均だけではないからです。
データの中心を1つの数字で表す値を代表値といい、代表的なものが平均・中央値・最頻値の3つです。この3つは、似ているようでいて、得意な場面も弱点もまるで違います。連載第2回では、その違いと“使い分け”を、図でやさしく見ていきましょう。
この連載は、統計のきほん(標準偏差・正規分布・相関・検定)の“ひとつ手前”——集めたデータをまず「要約して・見る」ための記述統計をあつかいます。
📏 連載「データの見方・まとめ方」(記述統計編・全4回)
集めたデータを「どう要約し、どう見るか」——データ分析の“いちばん最初の一歩”を、図でやさしく整理する連載です。

「真ん中」と言っても3種類。どれを使うかで、データの印象がガラッと変わるんだ。とくに平均はクセが強いよ。

代表値とは?|3つの「真ん中」
代表値は、たくさんのデータを「だいたいこのあたり」と1つの数字で代表させたものです。よく使う3つを、まず整理しましょう。
- 平均(へいきん)——すべて足して、個数で割った値。いちばん有名
- 中央値(ちゅうおうち)——小さい順に並べたとき、ちょうど真ん中にくる値
- 最頻値(さいひんち)——いちばん多く出てくる値
図を見てください。データが左右対称なら、この3つはほぼ同じ場所にきます。でも、データが歪んでいたり外れ値があったりすると、3つはバラバラの場所にズレるのです。
平均|全部を足して割る(でも外れ値に弱い)
平均は、すべての値を足して個数で割った、いちばんなじみのある代表値です。データ全体を使うので情報をムダなく活かせますが、大きな弱点があります。外れ値(極端な値)にとても弱いのです。
たとえば、5人の年収が「300・350・400・450・500(万円)」なら平均400万円で、実感どおり。でも、ここに1人だけ年収1億円の人が加わると、平均は約1992万円に跳ね上がります。6人のうち5人は500万円以下なのに、「平均約2000万円」では、まるで実態を表していません。これが、平均のワナです。
中央値|並べた“真ん中”(外れ値に強い)
中央値は、データを小さい順に並べて、ちょうど真ん中にくる値です(偶数個なら真ん中2つの平均)。
さきほどの「1人だけ1億円」の例でも、中央値は約425万円。極端な値が1つ増えても、真ん中の順位はほとんど動かないので、外れ値に引っぱられません。だから、年収・地価・世帯資産のように“一部の極端な値”を含むデータでは、平均より中央値のほうが実態をよく表します。「平均年収」より「中央値」を見るべき、と言われるのはこのためです。ニュースで『平均』と『中央値』が併記されているのを見かけたら、ぜひその差に注目してみてください。差が大きいほど、そのデータは一部の大きな値に引っぱられている、というサインなのです。
平均は全データを使うが外れ値に弱い。中央値は順位の真ん中なので外れ値に強い。歪んだデータでは中央値が頼りになる。
最頻値|いちばん多い値(カテゴリにも使える)
最頻値は、いちばん多く登場する値です。3つの中でいちばん地味ですが、独自の強みがあります。
それは、質的データ(カテゴリ)にも使えること。前回見たように、名義データ(血液型など)には平均も中央値も使えませんが、「いちばん多いのはA型」のように最頻値なら出せます。「人気No.1の商品」「いちばん多い回答」など、“最多”が知りたいときに活躍します。
どれを使う?|使い分けの早見表
3つの代表値は、データの性質や目的で使い分けます。
| 場面 | おすすめ | 理由 |
|---|---|---|
| 左右対称で外れ値がない | 平均 | 全データを活かせる |
| 外れ値・歪みがある(年収など) | 中央値 | 極端な値に強い |
| カテゴリ・最多が知りたい | 最頻値 | 質的データにも使える |
迷ったら、平均と中央値の両方を出して比べるのがおすすめです。2つが大きくズレていたら、「外れ値や歪みがあるぞ」というサイン。データの形をうかがう手がかりになります。この『2つを並べて比べる』というひと工夫が、難しい計算をしなくても、データの歪みやクセを見抜く近道になります。
Excelで計算する
3つの代表値は、Excelの関数で簡単に出せます。
- 平均——
=AVERAGE(範囲) - 中央値——
=MEDIAN(範囲) - 最頻値——
=MODE.SNGL(範囲)(いちばん多い1つ)
まずはこの3つを並べて出し、見比べてみてください。3つの数字の“ズレ方”から、そのデータがどんな形をしているかが見えてきます。
具体例で計算してみる|7人のテスト
実際に3つを計算してみましょう。7人のテストの点数が 40, 50, 50, 60, 70, 80, 90 だったとします(小さい順に並べ済み)。
- 平均——全部を足して7で割る:440 ÷ 7 = 約62.9点
- 中央値——真ん中(4番目)の値:60点
- 最頻値——いちばん多い値:2回出てくる50点
同じデータなのに、62.9点・60点・50点と、3つの“真ん中”がぜんぶ違いますね。どれが正しいというわけではなく、「何を真ん中とみなすか」が違うだけ。この感覚をつかんでおくと、代表値にだまされにくくなります。
「平均」が独り歩きする例
代表値の中でも、平均はとくに“独り歩き”しやすい数字です。ニュースでよく聞く平均値には、注意が必要なものがあります。
- 平均貯蓄額——一部の富裕層が平均を押し上げ、「多くの人の実感」とズレる。中央値のほうが実態に近い
- 平均年収——同上。高所得者に引っぱられて高めに出る
- 平均寿命——「いま何歳まで生きるか」とは少し違う指標(生まれた年の平均余命)
どれも「平均」という言葉の印象が、実態より強く伝わってしまう例です。平均値を見たら、『これは外れ値に引っぱられていないか? 中央値はどうか?』と一呼吸おく——それだけで、数字の受け取り方が一段かしこくなります。
平均の仲間|加重平均
ふつうの平均は、すべてのデータを“平等”に扱います。でも、「重要なものを重く見たい」ときには、加重平均を使います。
これは、それぞれに“重み”をつけて平均する方法です。たとえば成績を「テスト7割・課題3割」で評価するなら、テストの点を0.7倍、課題の点を0.3倍して足し合わせます。商品の評価をまとめるとき「件数の多い店ほど重く見る」のも加重平均です。
じつは、ふつうの平均も「すべての重みが等しい加重平均」と言えます。ExcelではSUMPRODUCT関数などで計算できます。“平等に扱う”か“重みをつける”か——目的に応じて選べると、平均の使い方がぐっと広がります。身近なところでは、学校の成績(評定)や、複数の調査結果をまとめるときなどに、この加重平均が活躍しています。「ただの平均」と思っていたものが、実は重みつきだった、というケースは意外と多いのです。
代表値だけでは足りない|ばらつきも見る
真ん中(代表値)が分かっても、それだけではデータの姿は“半分”しか見えていません。残りの半分が、ばらつき(散らばり)です。
たとえば、平均60点のクラスが2つあったとします。一方は55〜65点に固まり、もう一方は20〜100点まで散らばっている。平均は同じ60点でも、中身はまったくの別物です。代表値(真ん中)だけ見て「同じようなクラスだ」と判断すると、大事な違いを見落としてしまいます。
だから、代表値と一緒に「どれくらい散らばっているか」も見るのが鉄則。**「真ん中(代表値)」+「散らばり(標準偏差や四分位)」の2点セット**が、データ要約の基本形です。このばらつきの測り方は、次の連載「統計のきほん」の標準偏差でくわしく扱います。
まとめ
データの“真ん中”を表す代表値には、平均・中央値・最頻値の3つがあります。平均は全データを使うが外れ値に弱く、中央値は順位の真ん中なので外れ値に強く、最頻値は最多の値でカテゴリにも使えます。
左右対称なら3つはほぼ一致しますが、歪みや外れ値があるとバラバラにズレます。だから「平均年収」のような数字は鵜呑みにせず、中央値もあわせて見る。代表値を使い分けられると、データにだまされにくくなります。次回は、その“データの形”を目で見るためのヒストグラムに進みます。
「平均」は便利な一方で、いちばん誤解を生みやすい数字でもあります。世の中の“平均◯◯”という見出しを目にしたとき、『これは外れ値に引っぱられていないか?』と立ち止まれるかどうか。たったそれだけで、数字に踊らされる人と、数字を冷静に読める人の差がつきます。代表値の使い分けは、統計を学ぶ最初の“だまされない力”なのです。平均・中央値・最頻値という3つの“真ん中”を自在に使い分けられるようになれば、ニュースの統計も、仕事のデータも、ぐっと正しく読めるようになります。まずは手元のデータで、AVERAGEとMEDIANを並べて出し、その差を眺めてみてください。そこから、データの“本当の真ん中”が見えてきます。
代表値=データの真ん中を表す値(平均・中央値・最頻値)。
平均は外れ値に弱い/中央値は強い/最頻値はカテゴリにも使える。
歪んだデータは中央値が頼り。平均と中央値を見比べると形が分かる。
よくある質問(FAQ)
平均・中央値・最頻値の違いは何ですか?
A. 平均はすべて足して個数で割った値、中央値は小さい順に並べた真ん中の値、最頻値はいちばん多く出てくる値です。データが左右対称ならほぼ一致しますが、歪みや外れ値があるとバラバラにズレます。
なぜ平均は外れ値に弱いのですか?
A. 平均はすべての値を足すため、極端に大きい(小さい)値が1つあるだけで全体が引っぱられるからです。たとえば5人の年収に1人だけ1億円の人が混じると、平均は跳ね上がり、実態を表さなくなります。
平均年収より中央値を見たほうがよいのはなぜですか?
A. 年収のデータは一部の高所得者で右に歪むため、平均が実態より高く出やすいからです。中央値は順位の真ん中なので極端な値に引っぱられず、『ちょうど真ん中の人の年収』という実感に近い値を示します。
最頻値はどんなときに使いますか?
A. いちばん多い値・最多の回答を知りたいときに使います。最大の特徴は、血液型や商品カテゴリのような質的データ(平均や中央値が使えないデータ)にも使えることです。『人気No.1』を知りたいときなどに役立ちます。
3つのうちどれを使えばいいですか?
A. 左右対称で外れ値がなければ平均、年収のように外れ値や歪みがあれば中央値、カテゴリや最多を知りたいなら最頻値が向きます。迷ったら平均と中央値の両方を出し、ズレ具合からデータの歪みを確認するのがおすすめです。
平均と中央値が大きく違うとき、何が分かりますか?
A. データに外れ値や歪みがあるサインです。平均が中央値より大きければ右に歪んでいる(高い側に裾を引く)、小さければ左に歪んでいると分かります。2つを見比べるだけで、データの形のクセに気づけます。
Excelで代表値はどう計算しますか?
A. 平均はAVERAGE関数、中央値はMEDIAN関数、最頻値はMODE.SNGL関数で計算できます。3つを並べて出して見比べると、データの分布の形(ズレ方)が見えてきます。
あわせて読みたい
参考・一次ソース
- 総務省統計局「なるほど統計学園」(stat.go.jp)
- Microsoft「MEDIAN 関数」(support.microsoft.com)
※本記事は2026年6月時点の一般的な統計の考え方を初心者向けに整理したものです。Excelの機能名やボタン位置はバージョンにより異なる場合があります。

