Toybrick

混合量化经验总结

passion

注册会员

积分
100
楼主
发表于 2019-12-18 11:42:13    查看: 10822|回复: 1 | [复制链接]    打印 | 只看该作者
尝试混合量化后解决了速度与精度的折中,分享几点干货如下:
(1)如果非量化Convation, 需要将它的input节点的out项,本层的weight/bias从量化配置文件中删除。

(2)如果删除下面grap的pool, 需要将conv out0也删除。

(3) 非量化层,要求input/output layer均为非量化


eg:  非量化eltwise,需要非量化输入两个ReLu,  以及非量化输出Convolution weights/bias.
(4) Convoluation 的量化包括weights/bias/output
(5) 没有weights/bias 的layer, 只有output需要量化
回复

使用道具 举报

qiu47

注册会员

积分
124
沙发
发表于 2021-7-22 18:23:01 | 只看该作者
楼主你好,我在做混合量化时将网络前面一些层量化类型设置为float32作为非量化层,运行检测时会报错:ASSERT in NeuralNet.cpp.decompressKernel(1763): zrlBitWidth <= m_KernelZRLMaxBitWidth
如果只设置网络后面输出层为非量化层就没问题。这个该咋设置呢?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表