AIを整える
中級temperature・top-pを整える。
= AIの「ひらめき具合」を決めるツマミ
LLMの「温度」と top-p・top-k を実際に動かして、次の語の選ばれ方がどう変わるかを体感。スライダーを動かすと確率分布のバーが即・変化します。コード向けの低温から創作向けの高温まで、用途別おすすめも。
🔰 かんたんに言うと
AIの「ひらめき具合」を決めるツマミ(temperature)を動かして、答えの散らばり方を体感します。
TLDR — 30秒で分かる
temperature・top-p・top-k を動かすと次の語の確率分布が即変化。低温=とがる/高温=平ら、候補の絞り込みと再正規化をその場で体感。
主な機能
- temperature/top-p/top-k の3スライダーで即反映
- softmax後の確率をバーで可視化(採用/切り捨てを色分け)
- top-p・top-kの絞り込みと再正規化を表示
- 用途別おすすめ(コード低温〜創作高温)5プリセット
- エントロピー/最大確率の指標表示
- 送信ゼロ・全てブラウザ内計算
AIは次の1語を選ぶとき、候補それぞれに スコア(ロジット) を付け、 それを 確率 に変えてサイコロを振ります。 その「サイコロの振り方」を決めるのが temperature・top-p・top-k。
temperature
低い=とがる(堅実)/高い=平ら(多様)
top-p (nucleus)
確率の合計が p になるまでの上位だけ残す
top-k
スコア上位 k 個だけ残す
※ このツールは教育用の簡易デモです。候補と数値は挙動を体感するための例で、特定モデルの内部値ではありません。 すべてブラウザ内で計算し、入力はどこにも送信されません。
どの場面で試す?
PROBABILITY
次の語の確率分布
バーの長さ=softmax後の確率。採用候補(残った語) top-p / top-k で切り捨て
切り捨てられた語(薄いグレー)は、実際の生成では選ばれません。残った語だけで確率を 再正規化(合計100%に直す)してサイコロを振ります。括弧内が再正規化後の確率です。
PRESETS
用途別おすすめ早見
| 用途 | temperature | top-p |
|---|---|---|
| 💻 コード生成 | 0.2 | 0.95 |
| 📋 事実回答・要約 | 0.3 | 0.90 |
| 💬 一般的な会話 | 0.7 | 0.90 |
| 🧠 ブレスト・アイデア出し | 1.0 | 0.95 |
| ✍️ 創作・物語 | 1.3 | 0.98 |
HOW IT WORKS
しくみ — softmax と各パラメータ
① softmax で確率にする
モデルが各語に付けたスコア(ロジット zi)を、温度 T で割ってから指数関数にかけ、合計が1になるよう割り算します。
- T → 0:差が極端に強調され、最大ロジットの語がほぼ確率1(=貪欲法・常に同じ答え)。
- T = 1:素のスコア通りの確率。
- T が大きい:差がならされ、分布が一様(どの語にも一様にチャンス)に近づく。
② top-p(nucleus sampling)
確率の高い順に足していき、累積が p に達するまでの上位だけを候補に残します(p=0.9 なら「上位で確率の9割」を占める語まで)。 残りは捨て、残った語で再正規化。場面に応じて候補数が自動で変わるのが利点です。
③ top-k
確率上位 k 個だけを残す、シンプルな足切り。k=1 なら常に最有力の1語(貪欲法)。 候補数を固定したいときに使いますが、分布の形に関わらず数で切るので、top-p ほど柔軟ではありません。
よくある質問
Q. temperature とは何ですか?
A. 次の語を選ぶ「サイコロの振り方」を決める値です。低い(0付近)ほど最有力の語にほぼ固定され堅実・再現的に、高い(2付近)ほど候補がならされて多様・意外になります。softmax の exp(z/T) の T がこれです。
Q. temperature と top-p、どちらを使えばいいですか?
A. 多くの提供元は「どちらか一方だけ」を推奨します。両方を同時に強くいじると効果が読みにくくなります。まずは temperature だけ動かし、足りなければ top-p に切り替えるのがおすすめです。
Q. top-p(nucleus)と top-k の違いは何ですか?
A. top-p は「確率の合計が p になるまでの上位」を残す(候補数は場面で変動)方式、top-k は「上位 k 個」を数で固定して残す方式です。top-p のほうが分布の形に応じて柔軟です。
Q. temperature=0 にするとどうなりますか?
A. 最大ロジットの語が確率ほぼ1になり、実質「常に最有力の1語」を選ぶ貪欲法になります。同じ入力で毎回同じ出力になり、コードや事実回答で安定します。
Q. このバーの数値は本物のモデルの値ですか?
A. いいえ。挙動を体感するための代表的なロジット例で、特定モデルの内部値ではありません。式(softmax→top-p/top-k→再正規化)は実際のサンプリングと同じ仕組みです。
Q. 入力した内容はどこかに送信されますか?
A. いいえ。スライダー操作も計算もすべてブラウザ内で完結し、サーバーには何も送信しません(送信ゼロ)。
入力値はURLの「#」以降に入るためサーバーには送信されません。リンクを開くと同じ状態を復元します。
RELATED TOOLS
続けて整える