箱ひげ図とは?四分位数と外れ値の見方をやさしく図解
連載の最終回は、箱ひげ図(はこひげず)です。前回のヒストグラムと並ぶ、データの“ばらつき”を見るための代表的なグラフ。とくに外れ値の発見と複数グループの比較で、無類の強さを発揮します。
箱とひげ(線)でできた、ちょっと変わった見た目のグラフ。最初はとっつきにくいですが、読み方さえ分かれば、データのばらつきが一瞬でつかめる便利な道具です。図と一緒に、その仕組みを解きほぐしましょう。
この連載は、統計のきほん(標準偏差・正規分布・相関・検定)の“ひとつ手前”——集めたデータをまず「要約して・見る」ための記述統計をあつかいます。
📏 連載「データの見方・まとめ方」(記述統計編・全4回)
集めたデータを「どう要約し、どう見るか」——データ分析の“いちばん最初の一歩”を、図でやさしく整理する連載です。
- データの種類|量的データと質的データ
- 平均・中央値・最頻値|データの“真ん中”の測り方
- ヒストグラム|分布のかたちを見る
- 箱ひげ図(この記事)|四分位数で外れ値を見抜く

箱とひげの正体は『データを4等分する四分位数』。これさえ分かれば、箱ひげ図はもう読めるよ。

箱ひげ図とは?
箱ひげ図は、データのばらつきを、1つの「箱」と、その両側にのびる「ひげ」で表したグラフです。図のように、箱がデータの“中心の固まり”を、ひげが“広がり”を表します。
ヒストグラムが「分布の形」を細かく見せるのに対し、箱ひげ図は「ばらつきの要点」をコンパクトに見せるのが持ち味。場所をとらないので、後で見るように“複数のグループを横並びで比べる”のが得意です。この箱とひげの正体が、四分位数です。
四分位数|データを4等分する
箱ひげ図を理解するカギが四分位数です。これは、データを小さい順に並べて、4等分する位置の値のこと。
- 第1四分位数(Q1)——下から1/4の位置の値(下位25%の境目)
- 第2四分位数(Q2)——ちょうど真ん中=中央値(下位50%)
- 第3四分位数(Q3)——下から3/4の位置の値(下位75%の境目)
つまり四分位数は、「中央値(真ん中)」の考え方を、さらに細かく1/4ずつに分けたものです。データを“4つのグループ”に区切る境界線、とイメージすると分かりやすいでしょう。
箱とひげの読み方
四分位数が分かれば、箱ひげ図はもう読めます。図の各パーツを見てみましょう。
- 箱——Q1からQ3まで。データの“真ん中50%”がこの中に入る
- 箱の中の線——中央値(Q2)。データの真ん中の位置
- ひげ——箱から最小値・最大値まで伸びる線。データの広がりを表す
箱の幅(Q3−Q1)をIQR(四分位範囲)と呼びます。箱が大きいほどばらつきが大きく、小さいほどデータが中心に固まっているということ。中央値の線が箱の真ん中にあるか、どちらかに寄っているかで、分布の歪みも分かります。
箱=真ん中50%のデータ(Q1〜Q3)/中の線=中央値/ひげ=データの広がり。箱の幅(IQR)が大きいほど、ばらつきが大きい。
外れ値を見抜く|1.5×IQRルール
箱ひげ図の大きな強みが、外れ値を自動で見つけられることです。よく使われるのが「1.5×IQRルール」です。
具体的には、箱の端(Q1・Q3)から、IQRの1.5倍より外側にあるデータを「外れ値」とみなし、点(○)で示します。ひげは、この“外れ値ではない範囲”の端まで伸ばします。だから、ひげの外にぽつんと打たれた点を見れば、「これは外れ値だな」と機械的に判断できるのです。図の本体から離れた点が、まさにそれです。
複数グループの比較に強い
箱ひげ図が本当に輝くのは、複数のグループを並べて比べるときです。
たとえば「A店・B店・C店の客単価」を比べたいとき、3つの箱ひげ図を横に並べれば、それぞれの中央値・ばらつき・外れ値が、ひと目で比較できます。ヒストグラムを3つ並べるより、ずっとコンパクトで分かりやすい。「どのクラスの成績が安定しているか」「どの工場のばらつきが大きいか」——こうしたグループ間の比較で、箱ひげ図は第一の選択肢になります。棒グラフが“平均(高さ)だけ”を比べるのに対し、箱ひげ図は“ばらつきや外れ値まで含めて”比べられる。だから、グループの違いをより深く読み解けるのです。
ヒストグラムとの使い分け
ヒストグラムと箱ひげ図、どちらを使えばいいのでしょう。役割が違うので、目的で選びます。
- 1つのデータの“形”をくわしく見たい——ヒストグラム(山の数や細かい形が分かる)
- ばらつき・外れ値を手早く見たい/複数グループを比べたい——箱ひげ図(コンパクトで比較向き)
両方を併用するのも、もちろんアリです。まず箱ひげ図でグループ間のあたりをつけ、気になるグループをヒストグラムでくわしく見る——そんな合わせ技も効果的です。
Excelで作る
箱ひげ図も、Excel 2016以降なら標準で作れます。
- ①データ範囲を選ぶ——比べたいグループのデータを選択する
- ②「挿入」タブ → グラフの「箱ひげ図」を選ぶ——自動で作成される
複数のグループを選んでおけば、横並びの箱ひげ図が一気にできあがります。四分位数や外れ値の計算も、Excelが自動でやってくれるので安心です。
具体例で四分位数を出す
四分位数の感覚をつかむため、小さなデータで出してみましょう。11人のテストの点数を小さい順に並べます:20, 30, 40, 45, 50, 55, 60, 65, 70, 80, 95。
- 中央値(Q2)——真ん中(6番目)の 55点
- 第1四分位(Q1)——下半分の真ん中あたり=40点ごろ
- 第3四分位(Q3)——上半分の真ん中あたり=70点ごろ
この場合、箱は40〜70点(真ん中50%がここに入る)、中の線が55点、ひげが20点と95点のほうへ伸びます。四分位数の細かい計算方法には流儀がいくつかありますが、「データを4等分する位置」というイメージさえつかめれば十分です。
中央値の位置とひげの長さで“歪み”を読む
箱ひげ図は、ばらつきだけでなく分布の歪みも教えてくれます。見るのは2か所です。
- 中央値の線の位置——箱の真ん中ならほぼ左右対称。どちらかに寄っていれば、その逆側に歪んでいる
- ひげの長さ——片方のひげだけ長ければ、その方向に裾を引いている(外れ値が出やすい側)
たとえば、中央値の線が箱の左寄りで、右のひげが長ければ「右に歪んだデータ(年収型)」だと分かります。箱ひげ図は小さな図ですが、ばらつき・中心・歪み・外れ値という、データの要点をぎゅっと詰め込んでいるのです。
なぜ“真ん中50%”を見るのか|頑健なばらつき
箱が「真ん中50%」を表すことには、ちゃんと意味があります。両端の極端な値(外れ値)に左右されず、データの“中核”のばらつきだけをつかめるからです。
標準偏差は、すべての値を使うぶん外れ値に弱いという弱点がありました。一方、箱ひげ図が使うIQR(四分位範囲)は、外れ値の影響を受けにくい“頑健な”ばらつきの指標です。
だから、外れ値が混じりやすいデータ(年収・不動産・センサー値など)では、標準偏差より四分位数・箱ひげ図のほうが、実態に近い「ばらつきの姿」を見せてくれます。外れ値に強い要約がほしいときは、平均より中央値、標準偏差よりIQR——この対応を覚えておくと、データに振り回されにくくなります。
ここまで来ると、記述統計の道具が“外れ値に強いチーム”と“弱いチーム”に分かれているのが見えてきます。平均と標準偏差は全データを使うぶん外れ値に弱く、中央値・四分位数(箱ひげ図)は順位ベースなので外れ値に強い。扱うデータに外れ値が多そうなら後者を選ぶ——この判断ができると、要約の質がぐっと上がります。
まとめ|連載のおわりに
箱ひげ図は、四分位数を使って、データのばらつきと外れ値をコンパクトに表すグラフです。箱は真ん中50%のデータ、中の線は中央値、ひげは広がりを表し、1.5×IQRルールで外れ値を自動的に見つけられます。複数グループの比較で、とくに力を発揮します。
これで連載「データの見方・まとめ方」は完結です。データの種類を見分け、代表値で真ん中をつかみ、ヒストグラムで形を見て、箱ひげ図でばらつきを比べる。この“記述統計”の4ステップが、すべてのデータ分析の出発点です。ここを踏まえて、ぜひ統計のきほん(標準偏差・相関・検定)へ進んでください。お疲れさまでした。
派手な機械学習やAIが注目される時代でも、その入り口にあるのは、いつもこの“地味な記述統計”です。データの種類を見分け、代表値で真ん中をつかみ、グラフで形とばらつきを見る。この基本のキができていないと、どんな高度な分析も砂上の楼閣になってしまいます。逆に、ここさえ押さえておけば、これから出会うどんなデータとも、落ち着いて向き合えるはずです。まずは身近な数字を、グラフにして眺めるところから始めてみてください。種類を見分け、真ん中をつかみ、形とばらつきを見る——この一連の流れが自然にできるようになったとき、あなたはもう“データを読める人”です。お疲れさまでした。
箱ひげ図=四分位数でばらつきと外れ値をコンパクトに表す。
箱=真ん中50%/線=中央値/ひげ=広がり。1.5×IQRの外は外れ値。
複数グループの比較に最強。Excel 2016以降で自動作成できる。
よくある質問(FAQ)
箱ひげ図とは何ですか?
A. データのばらつきを、1つの箱とその両側にのびるひげで表したグラフです。四分位数をもとに、箱が真ん中50%のデータ、中の線が中央値、ひげが広がりを表します。外れ値の発見と複数グループの比較に強いのが特徴です。
四分位数とは何ですか?
A. データを小さい順に並べて4等分する位置の値です。第1四分位数(Q1)は下から1/4、第2四分位数(Q2)はちょうど真ん中=中央値、第3四分位数(Q3)は下から3/4の位置の値です。中央値をさらに細かく分けたものといえます。
箱ひげ図の箱とひげは何を表していますか?
A. 箱はQ1からQ3までで、データの真ん中50%が入ります。箱の中の線は中央値です。ひげは箱から最小値・最大値(外れ値を除く範囲)まで伸び、データの広がりを表します。箱が大きいほどばらつきが大きいことを示します。
箱ひげ図で外れ値はどう判断しますか?
A. よく使われる1.5×IQRルールでは、箱の端(Q1・Q3)からIQR(箱の幅)の1.5倍より外側にあるデータを外れ値とみなし、点で示します。ひげの外にぽつんと打たれた点を見れば、機械的に外れ値を判断できます。
ヒストグラムと箱ひげ図はどう使い分けますか?
A. 1つのデータの形(山の数や細かい分布)を詳しく見たいならヒストグラム、ばらつきや外れ値を手早く見たい・複数グループを比べたいなら箱ひげ図が向きます。まず箱ひげ図で比較し、気になる部分をヒストグラムで見る併用も有効です。
箱ひげ図は何に使うと便利ですか?
A. 複数のグループを並べて比べるときに特に便利です。たとえばA店・B店・C店の客単価を3つの箱ひげ図で横に並べれば、中央値・ばらつき・外れ値をひと目で比較できます。グループ間の比較では第一の選択肢になります。
箱ひげ図はExcelで作れますか?
A. 作れます。Excel 2016以降なら、データ範囲を選んで『挿入』タブの『箱ひげ図』グラフを選ぶだけで自動作成されます。四分位数や外れ値の計算もExcelが自動で行うため、複数グループを選べば横並びの図も簡単に作れます。
あわせて読みたい
参考・一次ソース
- 総務省統計局「なるほど統計学園」(stat.go.jp)
- Microsoft「箱ひげ図を作成する」(support.microsoft.com)
※本記事は2026年6月時点の一般的な統計の考え方を初心者向けに整理したものです。Excelの機能名やボタン位置はバージョンにより異なる場合があります。

