|
本帖最后由 jefferyzhang 于 2019-10-28 14:30 编辑
差异肯定是存在的,这俩网络运算复杂度差异本身就很大。
在RKNN的转换文档里有网络优化设计建议章节,可以参考下。
我提几个思路:
1. 硬件算子是Conv + Relu + maxpooling 是一个硬件算子,所以yolo里所有LeaklyRelu改为 Relu可以大大提高推理速度。
2. 尽量用3x3卷积,能提高速度(所有卷积都是可以拆成若干个3x3卷积集合的)
3. 减小input尺寸大小。
4. 量化(已经量化就请忽略。)
5. 多个计算棒并行等等
|
|