int4
イントフォー
INT4 quantization
DEFINITION
4 ビット整数で重みを表す量子化。fp16 の 1/4 サイズ、ローカル LLM で多用される。
DETAIL — 詳しく
GGUF の Q4_K_M、GPTQ、AWQ などが代表。1 重みあたり 0.5 バイト。Llama 70B が fp16 140GB → int4 35GB と劇的に縮む。精度は 95〜98% 程度に維持される実用域で、ローカル LLM の事実上の標準。1.58bit はさらに小さい次世代候補。