fp16

エフピーじゅうろく

half-precision floating-point / FP16

DEFINITION

16ビットで実数を表す浮動小数点数フォーマット。LLM 推論のデファクト精度。

DETAIL — 詳しく

1 重みあたり 2 バイト消費。fp32（4 バイト）の半分、int8（1 バイト）の倍。GPU の Tensor Core が高速に処理できるため、Llama・Qwen・Gemma など多くのモデルが fp16 を標準とする。bfloat16 (bf16) は同じ 16 ビットだが指数部の bit 配分が異なり、学習時の安定性で優位。

USE IN TOOLS — このツールで使われる用語

実際に「fp16」を扱えるツール

1.58bit を整える →

LLM 量子化の本命「BitNet b1.58」を体感。重みを {-1, 0, +1} の 3 値に整える様子の可視化、fp16/int8/int4/1.58bit のメモリ・電力比較まで。Llama 70B が約 14GB に。

ローカルLLMを整える →

自分のマシンで Llama・Qwen・Gemma などが動くかをひと目で判定。量子化・コンテキスト長も切替可。

RELATED TERMS — 関連する用語

「fp16」と関連の深い用語

りょうしか

ニューラルネットの重み・活性化を、より少ないビット数の数値で表現すること。

BitNet b1.58 AI

ビットネットいってんごじゅうはち

LLMの重みを {-1, 0, +1} の3値に量子化することで、log₂(3)≈1.58 bit/重みで表現できる手法。

イントエイト

ニューラルネットの重みを 8 ビット整数で表す量子化手法。fp16 の半分のサイズ。

← 用語集トップへ戻る

KOINOBORI ECOSYSTEM

私たちが運営するサイト

Koinobori

株式会社Koinobori

コーポレート — 法人研修・教材制作・AI支援

koinobori.co.jp

NOBORIBA

NOBORIBA® 研修サービス

研修事業 — 講師パートナー62名で全国対応

noboriba.jp

NOBORIBA

NOBORIBA® ビジネス交流会

SES × 異業種 — 東京で唯一の朝開催交流会

noboriba.net

totonoe

ここ

totonoe

Web ツール集 — 文字・お金・単位・IT・AI・教養

totonoe.tech