本文へスキップ
totonoe

🤖 AI

AIを整える

ChatGPTなどの生成AIの「見えない数字」を、見える化。

AIは料金や入力できる量が「文字数」ではなく独自の単位で決まります。料金のもとになるトークン数の見積もり、AIが一度に読める量、自分のパソコンでAIが動くか──生成AIを使うときに迷いやすい数字を、入れるだけで分かる道具をそろえました。

プロンプトを整える

= AIへの指示文のゴミ取り・整形

LLM投入前のテキストを掃除。ゼロ幅スペース・スマートクォート・連続空白を除去してトークン節約。

  • 不可視文字・ゼロ幅の除去
  • スマートクォート→普通の引用符
  • 連続空白の正規化
中級 開く

トークン数を整える

= AIが数える文字のかたまり(料金の単位)

GPT-4o・Claude・Gemini等7モデルでの推定トークン数を一括表示。コンテキスト制限とAPI料金見積もりの前提値に。

  • 7モデル一括トークン推定
  • 英語/日本語の比率検出
  • コンテキスト窓使用率
中級 開く

LLM料金を整える

= クラウドAIの利用料金の試算

プロンプトを貼ると主要LLM(GPT-4o/Claude/Gemini ほか14モデル)のAPI料金が一発で並ぶ。USD/JPY・バッチ・キャッシュ割引・月次予測まで。

  • 14モデル横断比較・安い順ソート
  • USD/JPY自動取得 (Frankfurter API)
  • プロンプトキャッシュ/バッチAPI 割引
中級 開く

ローカルLLMを整える

= 自分のPCで動かすAIの選び方

自分のMac/PCでLlama・Qwen・Gemma等が動くかを判定。量子化・コンテキスト長を切替えてメモリ要件を算出。

  • 14モデルの動作可否判定
  • 量子化(4/8/16bit)切替
  • コンテキスト長切替
専門 開く

1.58bit を整える

= AIを極限まで軽くする新技術(BitNet)

AIを軽くする新技術「BitNet b1.58」を体感。必要なメモリがどれだけ減るかをモデル別に比較し、スマホ・PCで動かせる大きさが分かる。

  • 4×4 行列でリアルタイム量子化可視化
  • 6 プリセット(1.5B〜405B)でメモリ比較
  • 6 精度(fp32/fp16/int8/int4/1.58bit/1bit)対応
専門 開く

埋め込みサイズを整える

= 文章をAIが扱う数字に変えたときの「容量」

文章をAI用の数字(ベクトル)に変える「埋め込み」の容量とコストを、OpenAI・Cohere・Voyage・BGEなどモデル別に比較。AIに社内文書を検索させる仕組み(RAG)の設計に。

  • 11モデルの次元比較
  • 文書数×次元×float型のストレージ計算
  • API/セルフホストのコスト比較
専門 開く

コンテキスト窓を整える

= AIが一度に読める文章の量

Claude 200K・GPT-4o 128K・Gemini 2.5 Pro 2M・Llama 4 10M。主要LLM 14モデルのコンテキスト窓を比較。

  • Anthropic/OpenAI/Google/Meta等14モデル
  • 入力サイズ→使用率バー(緑/橙/赤)
  • サイズ感の基準(ツイート〜大百科事典)
中級 開く

画像生成サイズ・アスペクト比を整える

= 画像生成AIの「縦×横」と「比」をちょうどよく決める

画像生成AIの解像度とアスペクト比を整えるツール。幅×高さから比・MP・向きを算出し、比と目標pxから解像度を逆算。8/64倍数丸めとSD/SDXL/MJ/DALL·E別推奨サイズつき。送信ゼロ。

  • 幅×高さ → アスペクト比(GCDで最簡分数)・メガピクセル・向き
  • 比+目標(長辺 or 合計画素数)から解像度を逆算
  • 8の倍数/64の倍数に丸め(比のずれ%も表示)
中級 開く

temperature・top-pを整える

= AIの「ひらめき具合」を決めるツマミ

temperature・top-p・top-kを動かすと次トークンの確率分布がバーで即変化。低温=とがる/高温=平ら、絞り込みと再正規化をsoftmaxで可視化する教育デモ。送信ゼロ。

  • temperature/top-p/top-k の3スライダーで即反映
  • softmax後の確率をバーで可視化(採用/切り捨てを色分け)
  • top-p・top-kの絞り込みと再正規化を表示
中級 開く

RAGチャンク設計を整える

= AIに大量の資料を読ませるときの「分け方」を決める

AIに大量の資料を読ませる「RAG」で、文書をどう分ける(チャンク)かを設計。必要な分割数・データ量・コストの見積もりに。送信ゼロ。

  • 文字数⇄トークン概算(日本語1.2字/token・英語4字/token切替)
  • チャンク数・必要ベクトル数・オーバーラップ込み総トークンを自動算出
  • chunk×top-k+余裕が文脈窓(8K/32K/128K)に収まるか判定
専門 開く

他のカテゴリ

KOINOBORI ECOSYSTEM

私たちが運営するサイト