🤖 AI
AIを整える。
ChatGPTなどの生成AIの「見えない数字」を、見える化。
AIは料金や入力できる量が「文字数」ではなく独自の単位で決まります。料金のもとになるトークン数の見積もり、AIが一度に読める量、自分のパソコンでAIが動くか──生成AIを使うときに迷いやすい数字を、入れるだけで分かる道具をそろえました。
プロンプトを整える
= AIへの指示文のゴミ取り・整形
LLM投入前のテキストを掃除。ゼロ幅スペース・スマートクォート・連続空白を除去してトークン節約。
- ● 不可視文字・ゼロ幅の除去
- ● スマートクォート→普通の引用符
- ● 連続空白の正規化
トークン数を整える
= AIが数える文字のかたまり(料金の単位)
GPT-4o・Claude・Gemini等7モデルでの推定トークン数を一括表示。コンテキスト制限とAPI料金見積もりの前提値に。
- ● 7モデル一括トークン推定
- ● 英語/日本語の比率検出
- ● コンテキスト窓使用率
LLM料金を整える
= クラウドAIの利用料金の試算
プロンプトを貼ると主要LLM(GPT-4o/Claude/Gemini ほか14モデル)のAPI料金が一発で並ぶ。USD/JPY・バッチ・キャッシュ割引・月次予測まで。
- ● 14モデル横断比較・安い順ソート
- ● USD/JPY自動取得 (Frankfurter API)
- ● プロンプトキャッシュ/バッチAPI 割引
ローカルLLMを整える
= 自分のPCで動かすAIの選び方
自分のMac/PCでLlama・Qwen・Gemma等が動くかを判定。量子化・コンテキスト長を切替えてメモリ要件を算出。
- ● 14モデルの動作可否判定
- ● 量子化(4/8/16bit)切替
- ● コンテキスト長切替
1.58bit を整える
= AIを極限まで軽くする新技術(BitNet)
AIを軽くする新技術「BitNet b1.58」を体感。必要なメモリがどれだけ減るかをモデル別に比較し、スマホ・PCで動かせる大きさが分かる。
- ● 4×4 行列でリアルタイム量子化可視化
- ● 6 プリセット(1.5B〜405B)でメモリ比較
- ● 6 精度(fp32/fp16/int8/int4/1.58bit/1bit)対応
埋め込みサイズを整える
= 文章をAIが扱う数字に変えたときの「容量」
文章をAI用の数字(ベクトル)に変える「埋め込み」の容量とコストを、OpenAI・Cohere・Voyage・BGEなどモデル別に比較。AIに社内文書を検索させる仕組み(RAG)の設計に。
- ● 11モデルの次元比較
- ● 文書数×次元×float型のストレージ計算
- ● API/セルフホストのコスト比較
コンテキスト窓を整える
= AIが一度に読める文章の量
Claude 200K・GPT-4o 128K・Gemini 2.5 Pro 2M・Llama 4 10M。主要LLM 14モデルのコンテキスト窓を比較。
- ● Anthropic/OpenAI/Google/Meta等14モデル
- ● 入力サイズ→使用率バー(緑/橙/赤)
- ● サイズ感の基準(ツイート〜大百科事典)
画像生成サイズ・アスペクト比を整える
= 画像生成AIの「縦×横」と「比」をちょうどよく決める
画像生成AIの解像度とアスペクト比を整えるツール。幅×高さから比・MP・向きを算出し、比と目標pxから解像度を逆算。8/64倍数丸めとSD/SDXL/MJ/DALL·E別推奨サイズつき。送信ゼロ。
- ● 幅×高さ → アスペクト比(GCDで最簡分数)・メガピクセル・向き
- ● 比+目標(長辺 or 合計画素数)から解像度を逆算
- ● 8の倍数/64の倍数に丸め(比のずれ%も表示)
temperature・top-pを整える
= AIの「ひらめき具合」を決めるツマミ
temperature・top-p・top-kを動かすと次トークンの確率分布がバーで即変化。低温=とがる/高温=平ら、絞り込みと再正規化をsoftmaxで可視化する教育デモ。送信ゼロ。
- ● temperature/top-p/top-k の3スライダーで即反映
- ● softmax後の確率をバーで可視化(採用/切り捨てを色分け)
- ● top-p・top-kの絞り込みと再正規化を表示
RAGチャンク設計を整える
= AIに大量の資料を読ませるときの「分け方」を決める
AIに大量の資料を読ませる「RAG」で、文書をどう分ける(チャンク)かを設計。必要な分割数・データ量・コストの見積もりに。送信ゼロ。
- ● 文字数⇄トークン概算(日本語1.2字/token・英語4字/token切替)
- ● チャンク数・必要ベクトル数・オーバーラップ込み総トークンを自動算出
- ● chunk×top-k+余裕が文脈窓(8K/32K/128K)に収まるか判定
他のカテゴリ