# 模型量化（Quantization）

模型量化是一種降低模型大小和加速推論的技術，透過減少模型權重和激活值的精度來實現。

## 完整說明

模型量化是一種模型壓縮技術，用於減少深度學習模型的大小和計算複雜度。它能夠將模型中浮點數（如32位浮點數）轉換為低精度整數（如8位整數），從而降低記憶體佔用和加速推論速度。常見應用包括在行動裝置和嵌入式系統上部署模型。

## 常見問題

### undefined



### undefined



### undefined



---

來源：https://aiterms.tw/terms/quantization
快查頁：https://aiterms.tw/terms/quantization
深度解說：https://aiterms.tw/learning/what-is-quantization