🤖 TAG
RAG / AI設計。
コンテキスト窓・トークン・埋め込み次元・ローカルLLM。RAG/LLMアプリ設計の前提を整える。
Claude 200K・GPT 128K・Gemini 2M。RAGの埋め込みベクトル次元とストレージ。ローカルLLMが自分のMacで動くか。LLMアプリの設計判断に必要な数字をワンクリックで揃えるツール群。
コンテキスト窓を整える
Claude 200K・GPT-4o 128K・Gemini 2.5 Pro 2M・Llama 4 10M。主要LLM 14モデルのコンテキスト窓を比較。
開くトークン数を整える
GPT-4o・Claude・Gemini等7モデルでの推定トークン数を一括表示。コンテキスト制限とAPI料金見積もりの前提値に。
開くLLM料金を整える
プロンプトを貼ると主要LLM(GPT-4o/Claude/Gemini ほか14モデル)のAPI料金が一発で並ぶ。USD/JPY・バッチ・キャッシュ割引・月次予測まで。
開く埋め込みサイズを整える
OpenAI・Cohere・Voyage・BGE等の埋め込みモデル11種のベクトル次元・ストレージ・コストを比較するRAG設計ツール。
開くローカルLLMを整える
自分のMac/PCでLlama・Qwen・Gemma等が動くかを判定。量子化・コンテキスト長を切替えてメモリ要件を算出。
開くプロンプトを整える
LLM投入前のテキストを掃除。ゼロ幅スペース・スマートクォート・連続空白を除去してトークン節約。
開く他のタグ