2026.06.10 2026.07.11

RAGとは？AIに自分の資料を読ませる仕組みをやさしく解説

ルミィ

「AIに会社の資料を読ませて答えさせたい」「自分のメモを覚えてくれたらいいのに」——そう思ったことはありませんか。NotebookLMに資料を読み込ませたり、Claudeのプロジェクトにファイルを置いたりしたとき、裏側で動いているのが今回のテーマ、RAG（ラグ）です。

RAGは Retrieval-Augmented Generation（検索拡張生成） の略。一言でいうと、質問のたびに、手元の資料から関連する部分を探し出して、AIに渡してから答えさせる仕組みです。

この記事では、RAGがなぜ必要なのか、仕組みの4ステップ、ファインチューニングとの違い、そして身近なRAGの例までをやさしく整理します。

ルミィ

「AIに資料を読ませる」のほとんどはRAG。仕組みが分かると、AIの答えの精度も上げやすくなるよ。

Contents

なぜRAGが必要？AIには「知らないこと」がある
仕組みは4ステップ
- 「埋め込み」をもう少しだけやさしく
RAGの良いところ
弱点と、よくある誤解
ファインチューニングとの違い
RAGの精度を上げる3つの工夫
RAGが向く質問・向かない質問
個人で始める現実的な3ステップ
身近なRAGの例
「検索」とRAGは何が違う？
導入でよくある失敗3つ
まとめ
よくある質問（FAQ）
あわせて読みたい
- 参考・一次ソース

なぜRAGが必要？AIには「知らないこと」がある

ChatGPTやClaudeのようなAIは、学習した時点までの一般知識しか持っていません。つまり、そのままでは次のものを知りません。

あなたの会社の社内資料・業務マニュアル
自分のメモ・過去の議事録
学習時点より新しい情報

「じゃあ資料を全部貼り付ければ？」と思いますが、資料が増えると全部は渡しきれませんし、毎回全部読ませるのは無駄が多い。そこで、「質問に関係する部分だけを、その都度探して渡す」という発想が生まれました。これがRAGです。

仕組みは4ステップ

RAGの中身は、準備2ステップ＋回答2ステップに分けると分かりやすいです。

①資料を小分けにする（チャンク化）：長い文書を、段落くらいの「かたまり」に分割する
②意味を数値にして保存（埋め込み）：各かたまりの「意味」を数値の並び（ベクトル）に変換し、データベースに入れておく
③質問と意味が近い部分を検索：質問も同じように数値化し、意味が近いかたまりを探し出す
④見つけた資料を添えてAIが回答：「この資料を参考に答えて」とAIに渡し、根拠つきで回答させる

RAGの流れの図解。1.資料を小分けにする 2.意味を数値化して保存 3.質問に近い部分を検索 4.見つけた資料を添えてAIが回答 — 図1：RAGの基本は「質問のたびに、関連する部分だけ探して渡す」。

「埋め込み」をもう少しだけやさしく

②の埋め込み（エンベディング）は、文章に「意味の地図上の住所」を割り振る技術です。「猫の餌やり」と「キャットフードの量」は言葉こそ違いますが、意味の地図では近所に置かれます。だから、キーワードが一致しなくても「意味が近い」資料を探せる——これがRAGの検索がただの文字検索と違うところです。

RAGの良いところ

自分の資料・最新情報に基づいて答えられる：AIの「知らない」を補える
出典を示せる：「この資料のここに書いてある」と根拠つきで答えさせやすい
でたらめ（ハルシネーション）を減らしやすい：手元の資料に基づく分、創作が入りにくい
資料の差し替えが簡単：覚え直しではなく、データベースの入れ替えで済む

弱点と、よくある誤解

検索に失敗すると、答えも外れる：RAGの精度は「探す」の精度で決まる。資料の分け方（チャンク設計）が重要
資料が整理されていないと弱い：ゴミを入れればゴミが出る。元資料の質がそのまま効く
「絶対に正しくなる」わけではない：資料に基づいても、読み違いや古い資料の参照は起こりうる

RAGは「AIを賢くする魔法」ではなく、「AIに正しいカンペを渡す仕組み」です。カンペの整理が、答えの質を決めます。

ファインチューニングとの違い

「AIに知識を足す」方法としてよく並ぶのが、ファインチューニング（追加学習）です。違いはシンプルです。

	ファインチューニング	RAG
イメージ	事前に丸暗記させる	その場で資料を調べて答える
知識の更新	再学習が必要で大変	資料を差し替えるだけ
出典の提示	難しい	得意（どの資料か示せる）
向いている用途	口調・形式・専門の型を覚えさせる	事実・社内知識に基づいて答えさせる

RAGとファインチューニングの違いの図解。ファインチューニングは事前に丸暗記させる、RAGはその場で資料を調べて答える — 図2：ファインチューニング＝事前に覚え込ませる。RAG＝その場で調べて答える。

「プロンプトで渡す・RAG・ファインチューニングをどう使い分けるか」は、2026年のLLM活用設計で詳しく整理しています。

RAGの精度を上げる3つの工夫

「RAGを入れたのに、思ったほど賢くない」——これは導入した人がほぼ必ず通る道です。原因の多くは仕組みではなく「探す」工程の質にあります。効く順に3つ挙げます。

①チャンクは「意味のまとまり」で切る

資料を機械的に「500文字ずつ」のように切ると、表の途中や説明の途中で分断されて、検索に引っかかっても文脈が欠けた断片が渡ります。見出し単位・段落単位など、人間が読んでも意味が通る単位で切るのが基本です。NotebookLMのような既製サービスはここを自動でやってくれますが、資料側の構造（見出しがちゃんと付いているか）が良いほど精度も上がります。

②「言葉の一致」と「意味の近さ」を組み合わせる

意味検索（ベクトル検索）は言い換えに強い一方、型番・固有名詞・条文番号のような「完全一致してほしい言葉」を取りこぼすことがあります。実務のRAGでは、キーワード検索と意味検索を併用するハイブリッド検索が定番です。既製サービスを使う場合も、「質問に固有名詞をそのまま入れる」だけで検索の精度はかなり変わります。

③答えではなく「参照箇所」を確認する癖をつける

RAGの答えには出典が付きます。答えだけ読んで満足せず、出典側を1クリックして原文を見る——この習慣があるだけで、読み違い・古い資料の参照にすぐ気づけます。

RAGが向く質問・向かない質問

RAGは万能ではなく、質問のタイプによって得意・不得意がはっきりしています。ここを知っておくと、「RAGがダメ」なのか「question の出し方が悪い」のかを切り分けられます。

質問のタイプ	相性	理由
「○○の手順は？」（資料のどこかに答えがある）	◎	該当箇所を探して答える、まさに本領
「この規程で△△は可能？」（根拠の参照）	◎	出典つきで答えられる
「資料全体を要約して」	○	対応するサービスが多いが、長大な資料は粗くなりがち
「全文書を横断して件数を集計して」	△	検索は「探す」のが仕事で、全件の集計は苦手
「資料にない新しい企画を考えて」	×	創作はRAGの担当外。通常のAIに聞く方がよい

コツは、「資料のどこかに答えが書いてある質問」に絞ること。それ以外は普通のAIとして聞き分ける——この切り替えができると、RAGの満足度は一気に上がります。

個人で始める現実的な3ステップ

ステップ1：NotebookLMで体験する——資料を読み込ませて、出典つきの回答を体感する。ここで「RAGとは何か」が身体で分かります
ステップ2：日常の道具に組み込む——Claudeのプロジェクトなど、ふだん使うAIに資料を常駐させて、仕事の中で使い続けてみる
ステップ3：必要になったら自前を検討——社外に出せない資料を扱いたくなったら、ローカル環境でのRAG構築を検討する（難易度は上がります）

いきなりステップ3から始めると挫折しやすいので、1→2→3の順がおすすめです。多くの人はステップ2まででも十分に元が取れます。

身近なRAGの例

NotebookLM：読み込ませた資料に基づいて、出典つきで答える——まさにRAG的な体験
Claudeのプロジェクト機能：置いたファイルを参照しながら回答
社内AIチャット：「社内規程に基づいて答えるAI」の多くはRAGで作られている

まず体験したい人は、NotebookLMの使い方から触ってみるのが近道です。どのAIがPDF読解に強いかはPDFを読ませるならどれ？で比較しています。

ルミィ

NotebookLMで「出典つきで答えてくれた！」と感動したアレ、裏側はRAGの考え方なんだよ。

「検索」とRAGは何が違う？

ここまで読んで「それって社内検索と何が違うの？」と思った方へ。違いは返ってくるものの形です。

検索：キーワードに合う文書のリストが返ってくる。読む・探すのは自分
RAG：質問に対する答えの文章が、出典つきで返ってくる。読む手間を肩代わりしてくれる

つまりRAGは「検索の置き換え」ではなく、検索の上に“読んで要約して答える”工程を足したもの。だからこそ、土台の検索が外れると答えも外れる——前の章の「探すの質がすべて」という話につながるわけです。

導入でよくある失敗3つ

仕組みを理解した人が、それでも踏みがちな失敗を3つだけ。どれも技術ではなく運用の問題です。

①資料が古いまま——RAGは「入れた資料」しか見ません。規程が改定されたのにデータベースが昔のまま、が一番危険なパターン。資料の更新当番を決めておきましょう
②何でも入れてしまう——下書き・没案・古いバージョンまで入れると、検索がノイズだらけになります。「正式版だけ」を入れるのが鉄則
③出典確認の習慣がないまま展開する——自分だけなら気をつけられても、チームに広げると「AIが言ったから」が独り歩きします。導入時に「重要な判断は原文を見る」のルールをセットで共有する

まとめると、RAGの運用は「資料の手入れ」がすべてです。仕組みが立派でも、本棚が散らかっていれば良い答えは返ってきません。

まとめ

RAG（検索拡張生成）は、質問のたびに資料から関連部分を探してAIに渡す仕組みです。資料を小分けにし、意味を数値化して保存し、質問に近い部分を検索し、添えて答えさせる——この4ステップがすべての基本です。

AIの「知らない」を、検索で補う。

出典を示せて、資料の差し替えも簡単。

ただし答えの質は「資料の整理」で決まる。

「AIに自分の知識を持たせたい」と思ったら、まずファインチューニングではなくRAG的な方法（NotebookLMやプロジェクト機能）から。それがいまの現実的な順番です。

よくある質問（FAQ）

RAGは何の略ですか？

A. Retrieval-Augmented Generation（リトリーバル・オーグメンテッド・ジェネレーション）の略で、日本語では「検索拡張生成」と訳されます。検索（Retrieval）で資料を探し、それを添えて生成（Generation）する仕組みです。

RAGとファインチューニングはどちらがいいですか？

A. 事実や社内知識に基づいて答えさせたいならRAG、口調や出力の型を覚えさせたいならファインチューニングが目安です。知識の追加・更新のしやすさと出典の提示では、RAGが有利です。

プログラミングなしでRAGを体験できますか？

A. できます。NotebookLMに資料を読み込ませる、Claudeのプロジェクトにファイルを置く、といった機能がRAG的な仕組みで動いています。

RAGを使えばAIは間違えなくなりますか？

A. いいえ。検索が適切な資料を見つけられなければ答えも外れますし、資料の読み違いも起こりえます。元資料の整理と、重要な判断では原文確認をセットにするのが安全です。

チャンクとは何ですか？

A. 長い資料を検索しやすくするために分割した「かたまり」のことです。段落や見出し単位など、意味が通る単位で切るほど検索の精度が上がります。

ベクトルデータベースとは何ですか？

A. 文章の「意味」を数値化したもの（埋め込みベクトル）を保存し、意味が近い順に探せるようにした専用のデータベースです。RAGの「検索」を高速に行うための裏方で、NotebookLMのような既製サービスでは意識する必要はありません。