TOOL
コンテキスト窓を整える。
AI に一度に渡せる「情報の入れもの」のサイズを、モデル別に並べて見比べ。長文 PDF や大量データを「どのモデルなら一発で読み込める?」が即わかります。
TLDR — 30秒で分かる
Claude 200K・GPT 128K・Gemini 2M・Llama 4 10M。14モデルのコンテキスト窓を比較。文書サイズから「どのモデルに入る」を即判定。
主な機能を見る
- Anthropic/OpenAI/Google/Meta等14モデル
- 入力サイズ→使用率バー(緑/橙/赤)
- サイズ感の基準(ツイート〜大百科事典)
- データ最終確認日のバッジ表示
コンテキスト窓とは、AI が一度に読める 「机の上のスペース」のようなもの。 ここに収まる量だけが、1 回の会話で AI に把握してもらえる範囲です。
ペーパーバック 1 冊
約 60K トークン
長編小説 1 本
約 200K トークン
聖書 1 冊まるごと
約 750K トークン
例えば「うちの 50 ページ PDF を AI に丸ごと読ませたい」とき、
どのモデルなら一発で入って、どれは溢れるか──下のツールでサクッと比較できます。
プリセット
RESULT
計算中…
MODELS
主要モデル一覧
バーの色は入力サイズに対する使用率:余裕 ぎりぎり はみ出す
| モデル | 窓 |
|---|---|
| Anthropic Claude Opus 4.7 | 200K |
| Anthropic Claude Sonnet 4.6 | 200K |
| Anthropic Claude Haiku 4.5 | 200K |
| OpenAI GPT-4o | 128K |
| OpenAI GPT-4o mini | 128K |
| OpenAI o1 | 200K |
| OpenAI o3-mini | 200K |
| Google Gemini 2.5 Pro | 2M |
| Google Gemini 2.5 Flash | 1M |
| Meta Llama 4 (Scout) | 10M |
| Meta Llama 3.3 70B | 128K |
| DeepSeek DeepSeek V3 | 128K |
| Alibaba Qwen 2.5 Max | 128K |
| Mistral Mistral Large 2 | 128K |
| xAI Grok 3 | 1M |
SCALE
窓の大きさを並べる
バーの長さが各モデルのコンテキスト窓の相対的な大きさです(最大 10M を100%として)。
SIZE REFERENCE
このトークン数ってどのくらい?
| サイズ感 | トークン数 |
|---|---|
| ツイート1本 | 100 |
| 英語1ページ | 750 |
| ブログ記事1本 | 1.5K |
| A4 PDFレポート | 5K |
| 短編小説 | 20K |
| ペーパーバック1冊 | 60K |
| 長編小説1冊 | 200K |
| 聖書(旧+新約) | 750K |
| 長編シリーズ1部 | 1M |
| ハリポタ全7巻 | 2M |
| 大百科事典クラス | 10M |
RELATED
あわせて使いたい
- ・LLM料金を整える — 窓に入る or 入らない の次は「いくらかかる?」
- ・トークン数を整える — 正確なトークン数を測りたいとき
- ・プロンプトを整える — 不要な空白を取って窓を節約
- ・埋め込みサイズを整える — 窓に入れず RAG で分割する設計判断に
- ・ローカル LLM を整える — API ではなく自分のマシンで動かしたいとき
よくある質問
- Q. コンテキスト窓って何?
- A. LLM が一度に処理できる入力+出力の最大トークン数のことです。「200K トークン」なら、英語で約150,000語、日本語で約20万字を一気に読ませられます。窓を超えると、古い会話や前半の文書が切り捨てられたり、エラーになったりします。
- Q. トークンと文字数の関係は?
- A. 英語は1トークン ≒ 4文字 ≒ 0.75単語、日本語は1トークン ≒ 1文字が目安(モデルによって変動)。本ツールの推定値はこの比率に基づく概算です。正確な数値は [トークン数を整える](/token/) で実測してください。
- Q. 窓が大きければ大きいほどよい?
- A. 必ずしも No です。大きい窓ほど (a) 料金が高くなる、(b) 推論時間が長くなる、(c) 後半の指示への注意が薄れる「Lost in the Middle」が起きやすくなる、というデメリットがあります。RAG で必要な部分だけ渡す設計のほうが、性能・コスト両面で有利なケースが多いです。
- Q. 出力トークンは別カウント?
- A. はい。例えば Claude Sonnet 4.6 の場合、入力200K + 出力64K の合計が窓に収まる必要があります。実務では「入力 = ほぼ全窓」「出力 = 数千〜数万」というケースが多いので、入力側を中心に考えれば概ね問題ありません。
- Q. Llama 4 の "10M" って実際使える?
- A. 公称値であり、推論プロバイダ・量子化・GPU メモリで実効値は変わります。論文の評価でも、超ロング窓の実効性能は窓の前半に偏りがちです。「10M 全部に注意が回る」と期待するより、「100K-1M なら確実」と捉えるのが安全です。
- Q. データはどのくらいの頻度で更新する?
- A. 2026-05-15 時点の公称値を掲載。窓サイズは半年〜1年単位で変動するので、料金ほど頻繁ではありません。新モデルリリース時 or 四半期に1度の更新を目安にしています。最新は各ベンダーの公式ドキュメントで確認してください。
RELATED TOOLS
続けて整える
AI・同カテゴリ
埋め込みサイズを整える
OpenAI・Cohere・Voyage・BGE などのベクトル次元・ストレージ・コストを比較。RAG設計の容量見積もりに。
開くAI・同カテゴリ
ローカルLLMを整える
自分のマシンで Llama・Qwen・Gemma などが動くかをひと目で判定。量子化・コンテキスト長も切替可。
開くAI・関連
LLM料金を整える
プロンプトを貼ると GPT-4o・Claude Sonnet 4.5・Gemini 2.5 Pro など主要 LLM の API 料金が一発で並ぶ。USD/JPY・バッチ・キャッシュ割引・月次予測まで。
開くAI・関連
トークン数を整える
GPT・Claude・Gemini など主要LLMでの推定トークン数を一括表示。コンテキスト制限とAPIコストの見積もりに。
開く