AIを整える
中級コンテキスト窓を整える。
= AIが一度に読める文章の量
AI に一度に渡せる「情報の入れもの」のサイズを、モデル別に並べて見比べ。長文 PDF や大量データを「どのモデルなら一発で読み込める?」が即わかります。
🔰 かんたんに言うと
AIが一度に読める文章の量(コンテキスト窓)をモデルごとに比較します。「このPDF、入る?」が分かります。
TLDR — 30秒で分かる
Claude 200K・GPT 128K・Gemini 2M・Llama 4 10M。14モデルのコンテキスト窓を比較。文書サイズから「どのモデルに入る」を即判定。
主な機能
- Anthropic/OpenAI/Google/Meta等14モデル
- 入力サイズ→使用率バー(緑/橙/赤)
- サイズ感の基準(ツイート〜大百科事典)
- データ最終確認日のバッジ表示
新しい発言
これから入る
コンテキスト窓
決まった広さ(トークン数)
押し出された古い発言
もう読めない
STEP 1
※ イメージ図です。下のツールで、あなたの文書がどのモデルの窓に入るか比較できます。
コンテキスト窓とは、AI が一度に読める 「机の上のスペース」のようなもの。 ここに収まる量だけが、1 回の会話で AI に把握してもらえる範囲です。
ペーパーバック 1 冊
約 60K トークン
長編小説 1 本
約 200K トークン
聖書 1 冊まるごと
約 750K トークン
例えば「うちの 50 ページ PDF を AI に丸ごと読ませたい」とき、
どのモデルなら一発で入って、どれは溢れるか──下のツールでサクッと比較できます。
プリセット
RESULT
計算中…
MODELS
主要モデル一覧
バーの色は入力サイズに対する使用率:余裕 ぎりぎり はみ出す
| モデル | 窓 |
|---|---|
| Anthropic Claude Opus 4.7 | 200K |
| Anthropic Claude Sonnet 4.6 | 200K |
| Anthropic Claude Haiku 4.5 | 200K |
| OpenAI GPT-4o | 128K |
| OpenAI GPT-4o mini | 128K |
| OpenAI o1 | 200K |
| OpenAI o3-mini | 200K |
| Google Gemini 2.5 Pro | 2M |
| Google Gemini 2.5 Flash | 1M |
| Meta Llama 4 (Scout) | 10M |
| Meta Llama 3.3 70B | 128K |
| DeepSeek DeepSeek V3 | 128K |
| Alibaba Qwen 2.5 Max | 128K |
| Mistral Mistral Large 2 | 128K |
| xAI Grok 3 | 1M |
SCALE
窓の大きさを並べる
バーの長さが各モデルのコンテキスト窓の相対的な大きさです(最大 10M を100%として)。
SIZE REFERENCE
このトークン数ってどのくらい?
| サイズ感 | トークン数 |
|---|---|
| ツイート1本 | 100 |
| 英語1ページ | 750 |
| ブログ記事1本 | 1.5K |
| A4 PDFレポート | 5K |
| 短編小説 | 20K |
| ペーパーバック1冊 | 60K |
| 長編小説1冊 | 200K |
| 聖書(旧+新約) | 750K |
| 長編シリーズ1部 | 1M |
| ハリポタ全7巻 | 2M |
| 大百科事典クラス | 10M |
RELATED
あわせて使いたい
- ・LLM料金を整える — 窓に入る or 入らない の次は「いくらかかる?」
- ・トークン数を整える — 正確なトークン数を測りたいとき
- ・プロンプトを整える — 不要な空白を取って窓を節約
- ・埋め込みサイズを整える — 窓に入れず RAG で分割する設計判断に
- ・ローカル LLM を整える — API ではなく自分のマシンで動かしたいとき
📖 このツールで使う用語
用語集トップへ →分からない用語があれば、クリックして解説をご覧ください。
よくある質問
Q. コンテキスト窓って何?
A. LLM が一度に処理できる入力+出力の最大トークン数のことです。「200K トークン」なら、英語で約150,000語、日本語で約20万字を一気に読ませられます。窓を超えると、古い会話や前半の文書が切り捨てられたり、エラーになったりします。
Q. トークンと文字数の関係は?
A. 英語は1トークン ≒ 4文字 ≒ 0.75単語、日本語は1トークン ≒ 1文字が目安(モデルによって変動)。本ツールの推定値はこの比率に基づく概算です。正確な数値は [トークン数を整える](/token/) で実測してください。
Q. 窓が大きければ大きいほどよい?
A. 必ずしも No です。大きい窓ほど (a) 料金が高くなる、(b) 推論時間が長くなる、(c) 後半の指示への注意が薄れる「Lost in the Middle」が起きやすくなる、というデメリットがあります。RAG で必要な部分だけ渡す設計のほうが、性能・コスト両面で有利なケースが多いです。
Q. 出力トークンは別カウント?
A. はい。例えば Claude Sonnet 4.6 の場合、入力200K + 出力64K の合計が窓に収まる必要があります。実務では「入力 = ほぼ全窓」「出力 = 数千〜数万」というケースが多いので、入力側を中心に考えれば概ね問題ありません。
Q. Llama 4 の "10M" って実際使える?
A. 公称値であり、推論プロバイダ・量子化・GPU メモリで実効値は変わります。論文の評価でも、超ロング窓の実効性能は窓の前半に偏りがちです。「10M 全部に注意が回る」と期待するより、「100K-1M なら確実」と捉えるのが安全です。
Q. データはどのくらいの頻度で更新する?
A. 2026-05-15 時点の公称値を掲載。窓サイズは半年〜1年単位で変動するので、料金ほど頻繁ではありません。新モデルリリース時 or 四半期に1度の更新を目安にしています。最新は各ベンダーの公式ドキュメントで確認してください。
入力値はURLの「#」以降に入るためサーバーには送信されません。リンクを開くと同じ状態を復元します。
RELATED TOOLS
続けて整える