AI 系统与性能模型压缩与量化SmoothQuant本页总览SmoothQuant SmoothQuant 通过在权重和激活之间迁移量化难度,降低激活 outlier 对低精度推理的影响。 核心问题 激活 outlier 为什么会破坏量化? 平滑系数如何选择? SmoothQuant 对不同模型和层的效果是否一致? 笔记模板 outlier 观察。 平滑方法。 校准流程。 精度结果。 性能结果。 适用边界。