BitNet b1.58

ビットネットいってんごじゅうはち

BitNet b1.58 / 1.58-bit LLM

DEFINITION

LLMの重みを {-1, 0, +1} の3値に量子化することで、log₂(3)≈1.58 bit/重みで表現できる手法。

DETAIL — 詳しく

Microsoft Researchが2024年2月に発表。各重みを3値に絞ることで、推論時の乗算が完全に不要になり、加算/減算/スキップだけで動作する。メモリは fp16 比約 1/10、推論速度約 10倍、電力は約 1/12 になり、3B params 以上では精度も fp16 と同等を維持。事前学習段階から1.58bit前提で学習する必要があり、既存モデルの後付け変換ではない。

EXAMPLE — 実用例

Llama 70B（fp16 で 140GB）を 1.58bit で持つと約 14GB、ハイエンド PC でも動作圏に入る。

USE IN TOOLS — このツールで使われる用語

実際に「BitNet b1.58」を扱えるツール

1.58bit を整える →

LLM 量子化の本命「BitNet b1.58」を体感。重みを {-1, 0, +1} の 3 値に整える様子の可視化、fp16/int8/int4/1.58bit のメモリ・電力比較まで。Llama 70B が約 14GB に。

ローカルLLMを整える →

自分のマシンで Llama・Qwen・Gemma などが動くかをひと目で判定。量子化・コンテキスト長も切替可。

LLM料金を整える →

プロンプトを貼ると GPT-4o・Claude Sonnet 4.5・Gemini 2.5 Pro など主要 LLM の API 料金が一発で並ぶ。USD/JPY・バッチ・キャッシュ割引・月次予測まで。

RELATED TERMS — 関連する用語

「BitNet b1.58」と関連の深い用語

りょうしか

ニューラルネットの重み・活性化を、より少ないビット数の数値で表現すること。

エフピーじゅうろく

16ビットで実数を表す浮動小数点数フォーマット。LLM 推論のデファクト精度。

イントエイト

ニューラルネットの重みを 8 ビット整数で表す量子化手法。fp16 の半分のサイズ。

パラメータ数 AI

パラメータすう

LLM が持つ学習可能な重みの総数。一般に「N B」（10 億単位）で表記される。

← 用語集トップへ戻る

KOINOBORI ECOSYSTEM

私たちが運営するサイト

Koinobori

株式会社Koinobori

コーポレート — 法人研修・教材制作・AI支援

koinobori.co.jp

NOBORIBA

NOBORIBA® 研修サービス

研修事業 — 講師パートナー62名で全国対応

noboriba.jp

NOBORIBA

NOBORIBA® ビジネス交流会

SES × 異業種 — 東京で唯一の朝開催交流会

noboriba.net

totonoe

ここ

totonoe

Web ツール集 — 文字・お金・単位・IT・AI・教養

totonoe.tech