量子化モデルとは?Q4・Q5・Q8の違いを初心者向けに解説
LM StudioやOllamaでローカルAIを試そうとすると、モデル名に「Q4」「Q5」「Q8」のような表記が出てくることがあります。
最初はかなり分かりにくいですが、ざっくり言うと、量子化とは「AIモデルを軽くするための圧縮」のようなものです。
この記事では、ローカルAI初心者向けに、量子化モデルとは何か、Q4・Q5・Q8で何が違うのか、どれを選べばいいのかを、やさしく整理します。

Q4とかQ8って暗号みたいだけど、まずは「軽さと賢さのバランス」と思えばOKだよ。
量子化モデルとは?
量子化モデルとは、元のAIモデルを軽くしたモデルです。
AIモデルは、そのままだとサイズが大きく、動かすのに多くのメモリやGPU性能が必要になります。そこで、モデルの情報を少し圧縮して、一般的なPCでも動かしやすくしたものが量子化モデルです。
なぜ量子化が必要なの?
ローカルAIでは、自分のPCでモデルを動かします。クラウドAIのように巨大なサーバーで動かすわけではないため、PCのメモリやGPUに収まるサイズにする必要があります。量子化によって、次のようなメリットがあります。
- モデルサイズが小さくなる
- 必要メモリが少なくなる
- 一般的なPCでも動かしやすくなる
- ダウンロード容量を抑えられる
一方で、圧縮するぶん、出力の品質が少し落ちる場合もあります。

Q4・Q5・Q8の違い
ざっくり言うと、数字が小さいほど軽く、数字が大きいほど元の品質に近くなります。
| 表記 | 特徴 |
|---|---|
| Q4 | 軽い。低スペックPCでも試しやすい |
| Q5 | 軽さと品質のバランス型 |
| Q8 | 品質は高めだが重い |
| 非量子化 | 品質は高いが、かなり重い |
初心者は、まずQ4かQ5あたりから試すのがおすすめです。
Q4はどんな人向け?
Q4は、軽さ重視です。
8GB〜16GBメモリのPCで、とりあえずローカルAIを動かしてみたい人に向いています。ただし、モデルによっては日本語が少し不自然になったり、長い文章で崩れたりすることがあります。
Q5はどんな人向け?
Q5は、軽さと品質のバランスを取りたい人向けです。
「Q4だと少し物足りない。でもQ8は重い」という場合に試しやすい選択肢です。初心者が迷ったら、Q5系を選ぶのも良い判断です。
Q8はどんな人向け?
Q8は、品質を重視したい人向けです。
ただし、そのぶん重くなります。メモリやGPUに余裕があるPCで試す方が安全です。
迷ったらどれを選ぶ?
初心者なら、まずはこの順番がおすすめです。
軽く試したい → Q4
バランス重視 → Q5
品質重視・PCに余裕あり → Q8最初から重いモデルを選ぶと、読み込めない・落ちる・遅すぎる、ということが起きやすいです。まず軽いものから試して、余裕があれば上げていくのが安全です。
量子化で賢さは落ちる?
少し落ちる場合があります。
ただし、短い要約・言い換え・簡単な翻訳下書き・メモ整理のような用途では、軽い量子化モデルでも十分使えることがあります。一方で、長文処理・複雑な推論・コード生成・専門的な判断では、量子化の影響が出やすい場合があります。
まとめ
量子化モデルは、ローカルAIを一般的なPCで動かしやすくするための軽量版モデルです。
Q4は軽さ重視、Q5はバランス型、Q8は品質重視、と考えると分かりやすいです。
初心者は、まずQ4かQ5から試して、自分のPCで快適に動くかを確認しましょう。

迷ったらQ4かQ5から。動きが軽くて、初めてのローカルAIにちょうどいいよ。
よくある質問(FAQ)
量子化モデルとは何ですか?
A. 元のAIモデルを圧縮して軽くしたモデルのことです。必要なメモリやダウンロード容量を抑えられるので、一般的なPCでもローカルAIを動かしやすくなります。そのぶん、出力品質が少し落ちる場合もあります。
Q4・Q5・Q8はどれを選べばいいですか?
A. 初心者はまずQ4かQ5がおすすめです。Q4は軽さ重視、Q5は軽さと品質のバランス型、Q8は品質重視ですが重くなります。まず軽いものから試して、余裕があれば数字を上げていくのが安全です。
量子化すると賢さは落ちますか?
A. 少し落ちる場合があります。短い要約や言い換え、メモ整理などの軽い用途なら、量子化モデルでも十分使えることが多いです。長文処理や複雑な推論、コード生成では影響が出やすいことがあります。
8GBのPCではどの量子化がいいですか?
A. メモリが少ない環境では、Q4のような軽い量子化+小さめのモデルが現実的です。動かして重い場合は、さらに小さいモデルを選ぶか、他のアプリを閉じて試してみてください。
あわせて読みたい
次に読むおすすめ記事
- ローカルAIでできること10選:軽いモデルで実際に何ができるかを知りたい人へ
- ローカルAIとクラウドAIの違い:そもそもの使い分けをおさらいしたい人へ
※本記事は2026年6月時点の公開情報をもとに整理しています。量子化の表記や対応状況はツール・モデルによって異なる場合があるため、最新情報は各公式サイトでご確認ください。

