本文へスキップ
totonoe

AIを整える

中級

temperature・top-pを整える

= AIの「ひらめき具合」を決めるツマミ

LLMの「温度」と top-p・top-k を実際に動かして、次の語の選ばれ方がどう変わるかを体感。スライダーを動かすと確率分布のバーが即・変化します。コード向けの低温から創作向けの高温まで、用途別おすすめも。

🔰 かんたんに言うと

AIの「ひらめき具合」を決めるツマミ(temperature)を動かして、答えの散らばり方を体感します。

i

TLDR — 30秒で分かる

temperature・top-p・top-k を動かすと次の語の確率分布が即変化。低温=とがる/高温=平ら、候補の絞り込みと再正規化をその場で体感。

主な機能

  • temperature/top-p/top-k の3スライダーで即反映
  • softmax後の確率をバーで可視化(採用/切り捨てを色分け)
  • top-p・top-kの絞り込みと再正規化を表示
  • 用途別おすすめ(コード低温〜創作高温)5プリセット
  • エントロピー/最大確率の指標表示
  • 送信ゼロ・全てブラウザ内計算

AIは次の1語を選ぶとき、候補それぞれに スコア(ロジット) を付け、 それを 確率 に変えてサイコロを振ります。 その「サイコロの振り方」を決めるのが temperaturetop-ptop-k

temperature

低い=とがる(堅実)/高い=平ら(多様)

top-p (nucleus)

確率の合計が p になるまでの上位だけ残す

top-k

スコア上位 k 個だけ残す

※ このツールは教育用の簡易デモです。候補と数値は挙動を体感するための例で、特定モデルの内部値ではありません。 すべてブラウザ内で計算し、入力はどこにも送信されません

どの場面で試す?

0.70
0 = ほぼ一択(堅実) 1.0 2.0 = 平ら(多様・荒れる)
1.00
0.05 = 上位だけ厳選 1.00 = 制限なし
0
0 = 制限なし 上位 k 個だけ(候補は最大8個)
用途別おすすめ:

PROBABILITY

次の語の確率分布

バーの長さ=softmax後の確率。採用候補(残った語) top-p / top-k で切り捨て

切り捨てられた語(薄いグレー)は、実際の生成では選ばれません。残った語だけで確率を 再正規化(合計100%に直す)してサイコロを振ります。括弧内が再正規化後の確率です。

PRESETS

用途別おすすめ早見

用途 temperature top-p
💻 コード生成 0.2 0.95
📋 事実回答・要約 0.3 0.90
💬 一般的な会話 0.7 0.90
🧠 ブレスト・アイデア出し 1.0 0.95
✍️ 創作・物語 1.3 0.98
temperature と top-p の併用は注意。多くの提供元は「どちらか一方だけ調整」を推奨しています。 両方を同時に強くいじると効果が読みにくくなるので、まずは temperature だけ、または top-p だけを動かすのがおすすめです。

HOW IT WORKS

しくみ — softmax と各パラメータ

① softmax で確率にする

モデルが各語に付けたスコア(ロジット zi)を、温度 T で割ってから指数関数にかけ、合計が1になるよう割り算します。

pi = exp(zi / T) / Σj exp(zj / T)
  • T → 0:差が極端に強調され、最大ロジットの語がほぼ確率1(=貪欲法・常に同じ答え)。
  • T = 1:素のスコア通りの確率。
  • T が大きい:差がならされ、分布が一様(どの語にも一様にチャンス)に近づく。

② top-p(nucleus sampling)

確率の高い順に足していき、累積が p に達するまでの上位だけを候補に残します(p=0.9 なら「上位で確率の9割」を占める語まで)。 残りは捨て、残った語で再正規化。場面に応じて候補数が自動で変わるのが利点です。

③ top-k

確率上位 k 個だけを残す、シンプルな足切り。k=1 なら常に最有力の1語(貪欲法)。 候補数を固定したいときに使いますが、分布の形に関わらず数で切るので、top-p ほど柔軟ではありません。

よくある質問

Q. temperature とは何ですか?

A. 次の語を選ぶ「サイコロの振り方」を決める値です。低い(0付近)ほど最有力の語にほぼ固定され堅実・再現的に、高い(2付近)ほど候補がならされて多様・意外になります。softmax の exp(z/T) の T がこれです。

Q. temperature と top-p、どちらを使えばいいですか?

A. 多くの提供元は「どちらか一方だけ」を推奨します。両方を同時に強くいじると効果が読みにくくなります。まずは temperature だけ動かし、足りなければ top-p に切り替えるのがおすすめです。

Q. top-p(nucleus)と top-k の違いは何ですか?

A. top-p は「確率の合計が p になるまでの上位」を残す(候補数は場面で変動)方式、top-k は「上位 k 個」を数で固定して残す方式です。top-p のほうが分布の形に応じて柔軟です。

Q. temperature=0 にするとどうなりますか?

A. 最大ロジットの語が確率ほぼ1になり、実質「常に最有力の1語」を選ぶ貪欲法になります。同じ入力で毎回同じ出力になり、コードや事実回答で安定します。

Q. このバーの数値は本物のモデルの値ですか?

A. いいえ。挙動を体感するための代表的なロジット例で、特定モデルの内部値ではありません。式(softmax→top-p/top-k→再正規化)は実際のサンプリングと同じ仕組みです。

Q. 入力した内容はどこかに送信されますか?

A. いいえ。スライダー操作も計算もすべてブラウザ内で完結し、サーバーには何も送信しません(送信ゼロ)。

入力値はURLの「#」以降に入るためサーバーには送信されません。リンクを開くと同じ状態を復元します。

RELATED TOOLS

続けて整える

KOINOBORI ECOSYSTEM

私たちが運営するサイト