Toybrick

标题: 混合量化经验总结 [打印本页]

作者: passion    时间: 2019-12-18 11:42
标题: 混合量化经验总结
尝试混合量化后解决了速度与精度的折中,分享几点干货如下:
(1)如果非量化Convation, 需要将它的input节点的out项,本层的weight/bias从量化配置文件中删除。

(2)如果删除下面grap的pool, 需要将conv out0也删除。

(3) 非量化层,要求input/output layer均为非量化


eg:  非量化eltwise,需要非量化输入两个ReLu,  以及非量化输出Convolution weights/bias.
(4) Convoluation 的量化包括weights/bias/output
(5) 没有weights/bias 的layer, 只有output需要量化
作者: qiu47    时间: 2021-7-22 18:23
楼主你好,我在做混合量化时将网络前面一些层量化类型设置为float32作为非量化层,运行检测时会报错:ASSERT in NeuralNet.cpp.decompressKernel(1763): zrlBitWidth <= m_KernelZRLMaxBitWidth
如果只设置网络后面输出层为非量化层就没问题。这个该咋设置呢?




欢迎光临 Toybrick (https://t.rock-chips.com/) Powered by Discuz! X3.3