totonoe

TOOL

コンテキスト窓を整える

AI に一度に渡せる「情報の入れもの」のサイズを、モデル別に並べて見比べ。長文 PDF や大量データを「どのモデルなら一発で読み込める?」が即わかります。

i

TLDR — 30秒で分かる

Claude 200K・GPT 128K・Gemini 2M・Llama 4 10M。14モデルのコンテキスト窓を比較。文書サイズから「どのモデルに入る」を即判定。

主な機能を見る
  • Anthropic/OpenAI/Google/Meta等14モデル
  • 入力サイズ→使用率バー(緑/橙/赤)
  • サイズ感の基準(ツイート〜大百科事典)
  • データ最終確認日のバッジ表示

コンテキスト窓とは、AI が一度に読める 「机の上のスペース」のようなもの。 ここに収まる量だけが、1 回の会話で AI に把握してもらえる範囲です。

ペーパーバック 1 冊

約 60K トークン

長編小説 1 本

約 200K トークン

聖書 1 冊まるごと

約 750K トークン

例えば「うちの 50 ページ PDF を AI に丸ごと読ませたい」とき、 どのモデルなら一発で入って、どれは溢れるか──下のツールでサクッと比較できます。

情報は 2026-05-15 時点 — 各ベンダー公式の公称値を掲載しています。料金は変動が大きいので別ツール(LLM料金を整える)に分離。最新は各モデルの公式ドキュメントもご確認ください。

あなたの文書はどのくらい?

推定式:1トークン ≒ 英語4文字 ≒ 英語0.75単語 ≒ 日本語1文字。正確な値は トークン数を整える で計測してください。

プリセット

RESULT

計算中…

MODELS

主要モデル一覧

バーの色は入力サイズに対する使用率:余裕 ぎりぎり はみ出す

モデル
Anthropic Claude Opus 4.7 200K
Anthropic Claude Sonnet 4.6 200K
Anthropic Claude Haiku 4.5 200K
OpenAI GPT-4o 128K
OpenAI GPT-4o mini 128K
OpenAI o1 200K
OpenAI o3-mini 200K
Google Gemini 2.5 Pro 2M
Google Gemini 2.5 Flash 1M
Meta Llama 4 (Scout) 10M
Meta Llama 3.3 70B 128K
DeepSeek DeepSeek V3 128K
Alibaba Qwen 2.5 Max 128K
Mistral Mistral Large 2 128K
xAI Grok 3 1M

SCALE

窓の大きさを並べる

バーの長さが各モデルのコンテキスト窓の相対的な大きさです(最大 10M を100%として)。

Llama 4 (Scout)
10M
Gemini 2.5 Pro
2M
Gemini 2.5 Flash
1M
Grok 3
1M
Claude Opus 4.7
200K
Claude Sonnet 4.6
200K
Claude Haiku 4.5
200K
o1
200K
o3-mini
200K
GPT-4o
128K
GPT-4o mini
128K
Llama 3.3 70B
128K
DeepSeek V3
128K
Qwen 2.5 Max
128K
Mistral Large 2
128K

SIZE REFERENCE

このトークン数ってどのくらい?

サイズ感 トークン数
ツイート1本 100
英語1ページ 750
ブログ記事1本 1.5K
A4 PDFレポート 5K
短編小説 20K
ペーパーバック1冊 60K
長編小説1冊 200K
聖書(旧+新約) 750K
長編シリーズ1部 1M
ハリポタ全7巻 2M
大百科事典クラス 10M

RELATED

あわせて使いたい

よくある質問

Q. コンテキスト窓って何?
A. LLM が一度に処理できる入力+出力の最大トークン数のことです。「200K トークン」なら、英語で約150,000語、日本語で約20万字を一気に読ませられます。窓を超えると、古い会話や前半の文書が切り捨てられたり、エラーになったりします。
Q. トークンと文字数の関係は?
A. 英語は1トークン ≒ 4文字 ≒ 0.75単語、日本語は1トークン ≒ 1文字が目安(モデルによって変動)。本ツールの推定値はこの比率に基づく概算です。正確な数値は [トークン数を整える](/token/) で実測してください。
Q. 窓が大きければ大きいほどよい?
A. 必ずしも No です。大きい窓ほど (a) 料金が高くなる、(b) 推論時間が長くなる、(c) 後半の指示への注意が薄れる「Lost in the Middle」が起きやすくなる、というデメリットがあります。RAG で必要な部分だけ渡す設計のほうが、性能・コスト両面で有利なケースが多いです。
Q. 出力トークンは別カウント?
A. はい。例えば Claude Sonnet 4.6 の場合、入力200K + 出力64K の合計が窓に収まる必要があります。実務では「入力 = ほぼ全窓」「出力 = 数千〜数万」というケースが多いので、入力側を中心に考えれば概ね問題ありません。
Q. Llama 4 の "10M" って実際使える?
A. 公称値であり、推論プロバイダ・量子化・GPU メモリで実効値は変わります。論文の評価でも、超ロング窓の実効性能は窓の前半に偏りがちです。「10M 全部に注意が回る」と期待するより、「100K-1M なら確実」と捉えるのが安全です。
Q. データはどのくらいの頻度で更新する?
A. 2026-05-15 時点の公称値を掲載。窓サイズは半年〜1年単位で変動するので、料金ほど頻繁ではありません。新モデルリリース時 or 四半期に1度の更新を目安にしています。最新は各ベンダーの公式ドキュメントで確認してください。

RELATED TOOLS

続けて整える