int8
イントエイト
INT8 quantization
DEFINITION
ニューラルネットの重みを 8 ビット整数で表す量子化手法。fp16 の半分のサイズ。
DETAIL — 詳しく
1 重みあたり 1 バイト。多くの量子化ライブラリ(GGUF, GPTQ, AWQ)でサポート。fp16 比でメモリ半分、推論速度はやや向上、精度劣化は小さい。スマホ・組込み向け推論の標準精度。さらに小さい int4(4 ビット、Q4_K_M など)はメモリ 1/4 になるが精度劣化が大きくなりがち。
イントエイト
INT8 quantization
DEFINITION
ニューラルネットの重みを 8 ビット整数で表す量子化手法。fp16 の半分のサイズ。
1 重みあたり 1 バイト。多くの量子化ライブラリ(GGUF, GPTQ, AWQ)でサポート。fp16 比でメモリ半分、推論速度はやや向上、精度劣化は小さい。スマホ・組込み向け推論の標準精度。さらに小さい int4(4 ビット、Q4_K_M など)はメモリ 1/4 になるが精度劣化が大きくなりがち。
実際に「int8」を扱えるツール
「int8」と関連の深い用語
KOINOBORI ECOSYSTEM
株式会社Koinobori
コーポレート — 法人研修・教材制作・AI支援
koinobori.co.jp
NOBORIBA® 研修サービス
研修事業 — 講師パートナー62名で全国対応
noboriba.jp
NOBORIBA® ビジネス交流会
SES × 異業種 — 東京で唯一の朝開催 交流会
noboriba.net
totonoe
Web ツール集 — 文字・お金・単位・IT・AI・教養
totonoe.tech