2026.06.14 2026.07.11

オートエンコーダとは？圧縮して再構成する仕組みをやさしく図解

ルミィ

ここまでCNN（画像）とRNN（系列）という、“判別する”ためのネットワークを見てきました。今回のオートエンコーダは少し毛色が違い、「入力をいったん圧縮して、また元に戻す」ことで学ぶ、ちょっと不思議なネットワークです。

「入れたものをそのまま出すなんて、何の役に立つの？」と思うかもしれません。ところがこの仕組みは、次元削減・異常検知・ノイズ除去、さらには画像生成の入り口まで、驚くほど幅広く使えます。図でそのカラクリを見ていきましょう。

この連載は、ニューラルネットとは？とディープラーニングの学習で学んだ「基本のしくみ」を土台にしています。まだの方は先に読むと、よりスッと入ってきます。

🧠 連載「ディープラーニングの地図」（全5回）

ニューラルネットの基本を土台に、画像・系列・生成といった“目的ごとの配線（アーキテクチャ）”を順にたどる連載です。

CNN（畳み込みニューラルネット）｜画像を“見る”ネットワーク
RNN・LSTM｜系列を“覚える”ネットワーク
オートエンコーダ（この記事）｜圧縮して“再構成する”ネットワーク
GAN（敵対的生成ネット）｜競い合って“生成する”ネットワーク
拡散モデル（Diffusion）｜ノイズから“生成する”ネットワーク

ルミィ

わざと細い通り道を作って“ぎゅっ”と圧縮するのがミソ。うまく元に戻せたら、本質をつかめた証拠だよ。

オートエンコーダの図解。入力5ノードをエンコーダで圧縮し、中央の細い潜在変数2ノードを通して、デコーダで出力5ノードへ復元する砂時計型のネットワーク。 — 図：細い「潜在変数」へ圧縮してから復元。うまく戻せる＝本質をつかめた証で、次元削減・異常検知・ノイズ除去に使えます。

Contents

オートエンコーダとは？
仕組み｜エンコーダ・潜在変数・デコーダ
使いみち①｜次元削減（PCAの仲間）
使いみち②｜異常検知
使いみち③｜ノイズ除去
発展｜VAEと“生成”への入り口
潜在空間ってどんな世界？
注意点｜ただのコピー機にしないために
教師なし学習の仲間として
生成の系譜｜GAN・拡散モデルへ
身近な使われ方
まとめ
よくある質問（FAQ）
あわせて読みたい
- 参考・一次ソース

オートエンコーダとは？

オートエンコーダは、入力とできるだけ同じものを出力するように学習するニューラルネットです。ただし途中に、わざと細いくびれ（ボトルネック）を作っておきます。

情報は、この細い通り道を通らないと出口にたどり着けません。つまりAIは、少ない情報量に“ぎゅっ”と圧縮しても、元に戻せるような“要点”を見つけ出す必要に迫られます。正解ラベルは要らず、入力そのものが手本になる——だから自分で自分を教える「自己教師あり」の一種です。

仕組み｜エンコーダ・潜在変数・デコーダ

オートエンコーダは、図のように3つの部分でできています。

エンコーダ（符号化器）——入力を、少ない数字へと圧縮していく前半部分
潜在変数（ボトルネック）——いちばん細いくびれ。圧縮された“要点”がここに収まる
デコーダ（復号器）——潜在変数から、元の入力を復元していく後半部分

学習のゴールは、「入力 ≈ 出力」になること。うまく復元できるようになったとき、中央の潜在変数には、そのデータの“本質”が詰まっている、というわけです。砂時計のように、いったん細く絞ってまた広げる形をイメージすると分かりやすいでしょう。

使いみち①｜次元削減（PCAの仲間）

潜在変数は「少ない数字に圧縮された表現」なので、そのまま**次元削減**に使えます。たくさんの特徴量を、数個の本質的な軸にまとめるわけです。

考え方は主成分分析（PCA）と似ていますが、大きな違いは、オートエンコーダは“曲がった”複雑な関係も圧縮できること。PCAがまっすぐな軸でまとめるのに対し、ニューラルネットの非線形な力で、より柔軟にデータの形を捉えられます。

使いみち②｜異常検知

オートエンコーダの応用で特に人気なのが異常検知です。発想がとても巧妙です。

まず、正常なデータだけでオートエンコーダを学習させます。すると、正常なデータは上手に復元できるようになります。ここに異常なデータ（見たことのないパターン）を入れると——学習していないので、うまく復元できず、入力と出力の差が大きくなる。この「復元の失敗度」を見れば、異常を見つけられるのです。

工場の機械の故障予兆、不正取引の検知、医療データの異常など、「正常はたくさんあるが、異常のサンプルは少ない」場面で重宝します。

使いみち③｜ノイズ除去

デノイジングオートエンコーダという使い方もあります。学習のとき、わざとノイズを乗せた画像を入力し、ノイズのないきれいな画像を出力させるように訓練するのです。

すると、ネットワークは「ノイズを取り除いて本来の姿を復元する力」を身につけます。かすれた写真の修復や、ざらついた画像の補正などに使えます。そして実はこの“ノイズを取り除く”という発想は、連載の最後に登場する拡散モデルの核心にもつながっていきます。

発展｜VAEと“生成”への入り口

オートエンコーダを“生成”に使えるように発展させたのがVAE（変分オートエンコーダ）です。

ふつうのオートエンコーダの潜在空間は、点がバラバラに散らばっていて、間を狙っても意味のあるものは出てきません。VAEは潜在空間をなめらかに整えるよう工夫することで、「潜在空間から適当な点を選んでデコーダに通すと、新しいデータが生まれる」ようにしました。

こうしてオートエンコーダは、判別だけでなく「データを生み出す」生成モデルへの橋渡しになります。次回のGAN、そして拡散モデルへと、生成の物語が続いていきます。

潜在空間ってどんな世界？

オートエンコーダが圧縮した先の「潜在空間」は、ただの数字の置き場ではありません。似たデータが近くに、違うデータが遠くに配置された、意味のある地図のような空間です。

うまく学習できると、この空間では面白いことが起きます。たとえば顔画像で学習した場合、「笑顔の点」と「真顔の点」の差を取ると“笑顔らしさ”の方向が分かり、別の顔にその方向を足すと笑顔にできる——そんな「意味の足し算・引き算」ができることもあります。潜在空間は、データの“本質的な特徴”が整理されて並んだ世界なのです。

注意点｜ただのコピー機にしないために

オートエンコーダには落とし穴があります。ボトルネックが太すぎると、AIは“手抜き”をして、ただ入力を丸写しするだけになってしまうのです。それでは「入力≈出力」は達成できても、本質は何も学べていません。

ボトルネックを十分に細くする——圧縮を強いることで、要点を学ばざるを得なくする
ノイズや制約を加える——デノイジングやVAEのように、ただのコピーをさせない工夫を入れる

「どれだけ絞るか」の塩梅が、設計の腕の見せどころ。圧縮しすぎても情報が失われ、緩すぎても何も学ばない——ちょうどよい細さを探すことになります。

教師なし学習の仲間として

オートエンコーダは、正解ラベルを使わない教師なし学習の仲間です。機械学習の3つの学び方でいえば、データそのものから構造を見つけるグループに入ります。

同じ次元削減でもPCAは線形、オートエンコーダは非線形。グループ分けのクラスタリングと組み合わせて「オートエンコーダで圧縮してからクラスタリング」といった合わせ技も使えます。教師なしの道具箱の、強力な一つです。

生成の系譜｜GAN・拡散モデルへ

生成モデルの歴史でみると、オートエンコーダ（特にVAE）は“生成”の先駆けの一つでした。VAEはなめらかな潜在空間から新しいデータを作れますが、生成物がややぼやけやすいという課題もありました。

その課題に別のアプローチで挑んだのが、次回のGAN（競争で鮮明に）と、最終回の拡散モデル（ノイズ除去で高品質に）です。圧縮・復元という素朴な発想が、生成AIの大きな流れの出発点になっている——そう捉えると、オートエンコーダの位置づけがよく見えてきます。

身近な使われ方

オートエンコーダ（やその発展形）は、意外と身近なところで働いています。

レコメンド（おすすめ）——ユーザーや商品の特徴を圧縮した表現を作り、好みの近さを測るのに使う
画像・音声の検索——「似たもの」を探すとき、圧縮表現どうしの近さで類似度を判定する
データ圧縮の研究——画像や音声を、少ない情報で復元できる形に圧縮する試み
前処理——たくさんの特徴量を圧縮してから、別の機械学習モデルに渡す

「圧縮した表現（潜在変数）そのものが役に立つ」というのが共通点です。出力をそのまま使うより、“中央でできた要点”を取り出して別の用途に活かす——これがオートエンコーダの実用的な使い方です。出力（復元結果）だけを見て『入力と同じものが出てくるだけ』と侮ってはいけません。本当の価値は、その途中にできる“凝縮された表現”のほうにあるのです。

まとめ

オートエンコーダは、入力をいったん細いボトルネックに圧縮し、また元に戻すことで、データの“本質”を学ぶネットワークです。正解ラベルが要らない自己教師ありの代表で、次元削減・異常検知・ノイズ除去と、応用範囲はとても広いものでした。

「圧縮してまた戻す」という、一見すると地味で不思議な仕組み。けれどそこには、『うまく戻せる＝本質をつかめた』という、機械学習の核心とも言える考え方が詰まっていました。だからこそ、次元削減から異常検知、ノイズ除去、レコメンドや類似検索、そして生成まで、こんなにも幅広く使えるのです。そしてVAEを通じて開いた“生成”の扉の先に、次回からのGANと拡散モデルが待っています。素朴な発想が、現代の画像生成AIへとつながっていく——その出発点が、このオートエンコーダなのです。

「うまく圧縮して戻せる＝本質をつかめた」というシンプルな考え方が、これだけ多くの用途を生みます。そしてVAEを通じて、“生成”の世界への入り口にもなりました。次回からは、いよいよ画像を生み出すネットワーク——GANと拡散モデルに進みます。

オートエンコーダ＝圧縮して復元し、本質を学ぶ（自己教師あり）。

用途＝次元削減・異常検知（復元の失敗で発見）・ノイズ除去。

VAEへ発展し、生成モデルへの橋渡しになる。

よくある質問（FAQ）

オートエンコーダとは何ですか？

A. 入力とできるだけ同じものを出力するよう学習するニューラルネットです。途中にわざと細いボトルネックを設け、少ない情報に圧縮しても復元できる“要点”を学ばせます。正解ラベルが不要な自己教師ありの一種です。

オートエンコーダはどんな仕組みですか？

A. 入力を圧縮するエンコーダ、圧縮された要点が収まる潜在変数（ボトルネック）、そこから復元するデコーダの3つでできています。『入力≈出力』になるよう学習し、中央の潜在変数にデータの本質が詰まります。

オートエンコーダとPCAの違いは何ですか？

A. どちらも次元削減に使えますが、PCAがまっすぐな軸でまとめるのに対し、オートエンコーダはニューラルネットの非線形な力で曲がった複雑な関係も圧縮できます。より柔軟にデータの形を捉えられるのが違いです。

オートエンコーダで異常検知ができるのはなぜですか？

A. 正常なデータだけで学習させると、正常はうまく復元できますが、見たことのない異常データは復元に失敗し、入力と出力の差が大きくなります。この『復元の失敗度』を見ることで異常を見つけられます。

デノイジングオートエンコーダとは何ですか？

A. わざとノイズを乗せた入力から、ノイズのないきれいな出力を復元するよう学習させたものです。ノイズを取り除く力を身につけ、画像の修復などに使えます。この発想は拡散モデルにもつながります。

VAE（変分オートエンコーダ）とは何ですか？

A. オートエンコーダを生成に使えるよう発展させたものです。潜在空間をなめらかに整えることで、潜在空間から適当な点を選んでデコーダに通すと新しいデータが生まれるようにしました。生成モデルへの入り口になります。

オートエンコーダは何に使われますか？

A. 次元削減（データの可視化や前処理）、異常検知（故障予兆や不正検知）、ノイズ除去（画像の修復）などに使われます。VAEを通じて画像生成の基礎にもなっています。