🤖 TAG

RAG / AI設計。

コンテキスト窓・トークン・埋め込み次元・ローカルLLM。RAG/LLMアプリ設計の前提を整える。

Claude 200K・GPT 128K・Gemini 2M。RAGの埋め込みベクトル次元とストレージ。ローカルLLMが自分のMacで動くか。LLMアプリの設計判断に必要な数字をワンクリックで揃えるツール群。

コンテキスト窓を整える

Claude 200K・GPT-4o 128K・Gemini 2.5 Pro 2M・Llama 4 10M。主要LLM 14モデルのコンテキスト窓を比較。

トークン数を整える

GPT-4o・Claude・Gemini等7モデルでの推定トークン数を一括表示。コンテキスト制限とAPI料金見積もりの前提値に。

LLM料金を整える

プロンプトを貼ると主要LLM(GPT-4o/Claude/Gemini ほか14モデル)のAPI料金が一発で並ぶ。USD/JPY・バッチ・キャッシュ割引・月次予測まで。

埋め込みサイズを整える

文章をAI用の数字（ベクトル）に変える「埋め込み」の容量とコストを、OpenAI・Cohere・Voyage・BGEなどモデル別に比較。AIに社内文書を検索させる仕組み(RAG)の設計に。

ローカルLLMを整える

自分のMac/PCでLlama・Qwen・Gemma等が動くかを判定。量子化・コンテキスト長を切替えてメモリ要件を算出。

プロンプトを整える

LLM投入前のテキストを掃除。ゼロ幅スペース・スマートクォート・連続空白を除去してトークン節約。

他のタグ

私たちが運営するサイト