校准是为模型权重和激活选择边界的过程。为了简单起见,这里只描述了对称范围的校准(工业界一般对称量化即可满足需求),如对称量化所需。这里考虑三种校准方法:
Max:使用校准期间的最大绝对值;Histogram:将范围设置为校准期间看到的绝对值分布的百分位。Entropy:使用KL散度来最小化原始浮点值和量化比特表示的值之间的信息损失。
我们都知道量化的过程与数据的分布有关。如下图所示:当数据的直方图分布比较均匀时,高精度向低精度进行映射就会将表示空间利用比较充分;如果分布不均匀,就会浪费很大的表示空间。

关于上面这种直接将量化阈值设置为 |max| 的方法,它的显著特点是int8的表示空间没有充分利用,因此称为不饱和量化<
下一篇:戴尔笔记本电脑各项功能键指南