totonoe

int8

イントエイト

INT8 quantization

DEFINITION

ニューラルネットの重みを 8 ビット整数で表す量子化手法。fp16 の半分のサイズ。

DETAIL — 詳しく

1 重みあたり 1 バイト。多くの量子化ライブラリ(GGUF, GPTQ, AWQ)でサポート。fp16 比でメモリ半分、推論速度はやや向上、精度劣化は小さい。スマホ・組込み向け推論の標準精度。さらに小さい int4(4 ビット、Q4_K_M など)はメモリ 1/4 になるが精度劣化が大きくなりがち。

USE IN TOOLS — このツールで使われる用語

実際に「int8」を扱えるツール

RELATED TERMS — 関連する用語

「int8」と関連の深い用語

← 用語集トップへ戻る

KOINOBORI ECOSYSTEM

私たちが運営するサイト