关注公众号【算法码上来】,每日算法干货马上就来!
上一篇我们讲解了矩阵乘法量化的基本原理,这一篇来讲解一下量化前需要做的一些准备工作——量化感知训练。
什么是量化感知训练呢?简单来说就是,浮点数转整数的过程中会产生精度的损失。如果你直接强行转换,然后进行量化推理(这叫训练后量化),那模型效果肯定会下降。所以需要在训练的时候就加入量化操作,继续finetune一会儿,弥补这部分损失。
回顾上一篇讲到的矩阵乘法量化过程,对于两个矩阵的乘法$C=AB$,可以先将$A$和$B$量化为整数矩阵$\frac{s}{c_1}A$和$\frac{s}{c_2}B$。