跳到主要内容

SmoothQuant

SmoothQuant 通过在权重和激活之间迁移量化难度,降低激活 outlier 对低精度推理的影响。

核心问题

  • 激活 outlier 为什么会破坏量化?
  • 平滑系数如何选择?
  • SmoothQuant 对不同模型和层的效果是否一致?

笔记模板

  • outlier 观察。
  • 平滑方法。
  • 校准流程。
  • 精度结果。
  • 性能结果。
  • 适用边界。