RAGとは?AIに自分の資料を読ませる仕組みをやさしく解説
「AIに会社の資料を読ませて答えさせたい」「自分のメモを覚えてくれたらいいのに」——そう思ったことはありませんか。NotebookLMに資料を読み込ませたり、Claudeのプロジェクトにファイルを置いたりしたとき、裏側で動いているのが今回のテーマ、RAG(ラグ)です。
RAGは Retrieval-Augmented Generation(検索拡張生成) の略。一言でいうと、質問のたびに、手元の資料から関連する部分を探し出して、AIに渡してから答えさせる仕組みです。
この記事では、RAGがなぜ必要なのか、仕組みの4ステップ、ファインチューニングとの違い、そして身近なRAGの例までをやさしく整理します。

「AIに資料を読ませる」のほとんどはRAG。仕組みが分かると、AIの答えの精度も上げやすくなるよ。
なぜRAGが必要?AIには「知らないこと」がある
ChatGPTやClaudeのようなAIは、学習した時点までの一般知識しか持っていません。つまり、そのままでは次のものを知りません。
- あなたの会社の社内資料・業務マニュアル
- 自分のメモ・過去の議事録
- 学習時点より新しい情報
「じゃあ資料を全部貼り付ければ?」と思いますが、資料が増えると全部は渡しきれませんし、毎回全部読ませるのは無駄が多い。そこで、「質問に関係する部分だけを、その都度探して渡す」という発想が生まれました。これがRAGです。
仕組みは4ステップ
RAGの中身は、準備2ステップ+回答2ステップに分けると分かりやすいです。
- ①資料を小分けにする(チャンク化):長い文書を、段落くらいの「かたまり」に分割する
- ②意味を数値にして保存(埋め込み):各かたまりの「意味」を数値の並び(ベクトル)に変換し、データベースに入れておく
- ③質問と意味が近い部分を検索:質問も同じように数値化し、意味が近いかたまりを探し出す
- ④見つけた資料を添えてAIが回答:「この資料を参考に答えて」とAIに渡し、根拠つきで回答させる

「埋め込み」をもう少しだけやさしく
②の埋め込み(エンベディング)は、文章に「意味の地図上の住所」を割り振る技術です。「猫の餌やり」と「キャットフードの量」は言葉こそ違いますが、意味の地図では近所に置かれます。だから、キーワードが一致しなくても「意味が近い」資料を探せる——これがRAGの検索がただの文字検索と違うところです。
RAGの良いところ
- 自分の資料・最新情報に基づいて答えられる:AIの「知らない」を補える
- 出典を示せる:「この資料のここに書いてある」と根拠つきで答えさせやすい
- でたらめ(ハルシネーション)を減らしやすい:手元の資料に基づく分、創作が入りにくい
- 資料の差し替えが簡単:覚え直しではなく、データベースの入れ替えで済む
弱点と、よくある誤解
- 検索に失敗すると、答えも外れる:RAGの精度は「探す」の精度で決まる。資料の分け方(チャンク設計)が重要
- 資料が整理されていないと弱い:ゴミを入れればゴミが出る。元資料の質がそのまま効く
- 「絶対に正しくなる」わけではない:資料に基づいても、読み違いや古い資料の参照は起こりうる
RAGは「AIを賢くする魔法」ではなく、「AIに正しいカンペを渡す仕組み」です。カンペの整理が、答えの質を決めます。
ファインチューニングとの違い
「AIに知識を足す」方法としてよく並ぶのが、ファインチューニング(追加学習)です。違いはシンプルです。
| ファインチューニング | RAG | |
|---|---|---|
| イメージ | 事前に丸暗記させる | その場で資料を調べて答える |
| 知識の更新 | 再学習が必要で大変 | 資料を差し替えるだけ |
| 出典の提示 | 難しい | 得意(どの資料か示せる) |
| 向いている用途 | 口調・形式・専門の型を覚えさせる | 事実・社内知識に基づいて答えさせる |

「プロンプトで渡す・RAG・ファインチューニングをどう使い分けるか」は、2026年のLLM活用設計で詳しく整理しています。
身近なRAGの例
- NotebookLM:読み込ませた資料に基づいて、出典つきで答える——まさにRAG的な体験
- Claudeのプロジェクト機能:置いたファイルを参照しながら回答
- 社内AIチャット:「社内規程に基づいて答えるAI」の多くはRAGで作られている
まず体験したい人は、NotebookLMの使い方から触ってみるのが近道です。どのAIがPDF読解に強いかはPDFを読ませるならどれ?で比較しています。

NotebookLMで「出典つきで答えてくれた!」と感動したアレ、裏側はRAGの考え方なんだよ。
まとめ
RAG(検索拡張生成)は、質問のたびに資料から関連部分を探してAIに渡す仕組みです。資料を小分けにし、意味を数値化して保存し、質問に近い部分を検索し、添えて答えさせる——この4ステップがすべての基本です。
AIの「知らない」を、検索で補う。
出典を示せて、資料の差し替えも簡単。
ただし答えの質は「資料の整理」で決まる。
「AIに自分の知識を持たせたい」と思ったら、まずファインチューニングではなくRAG的な方法(NotebookLMやプロジェクト機能)から。それがいまの現実的な順番です。
よくある質問(FAQ)
RAGは何の略ですか?
A. Retrieval-Augmented Generation(リトリーバル・オーグメンテッド・ジェネレーション)の略で、日本語では「検索拡張生成」と訳されます。検索(Retrieval)で資料を探し、それを添えて生成(Generation)する仕組みです。
RAGとファインチューニングはどちらがいいですか?
A. 事実や社内知識に基づいて答えさせたいならRAG、口調や出力の型を覚えさせたいならファインチューニングが目安です。知識の追加・更新のしやすさと出典の提示では、RAGが有利です。
プログラミングなしでRAGを体験できますか?
A. できます。NotebookLMに資料を読み込ませる、Claudeのプロジェクトにファイルを置く、といった機能がRAG的な仕組みで動いています。
RAGを使えばAIは間違えなくなりますか?
A. いいえ。検索が適切な資料を見つけられなければ答えも外れますし、資料の読み違いも起こりえます。元資料の整理と、重要な判断では原文確認をセットにするのが安全です。
あわせて読みたい
参考・一次ソース
- Lewis et al.「Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks」(arXiv:2005.11401)
- IBM「What is RAG (Retrieval Augmented Generation)?」(ibm.com)
※本記事は2026年6月時点の公開情報をもとに整理しています。各サービスの機能・仕様は変わることがあるため、最新情報は公式サイトでご確認ください。

