Toybrick

Yolo 网络性能指标

farces

新手上路

积分
48
QQ
楼主
发表于 2019-10-28 12:02:51    查看: 7319|回复: 5 | [复制链接]    打印 | 只看该作者
图1.tiny性能


图2.yolo3全网络

yolo的网络性能怎么差别这么大?谁知道如何优化全网络的性能?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

jefferyzhang

版主

积分
12958
沙发
发表于 2019-10-28 14:25:42 | 只看该作者
本帖最后由 jefferyzhang 于 2019-10-28 14:30 编辑

差异肯定是存在的,这俩网络运算复杂度差异本身就很大。

在RKNN的转换文档里有网络优化设计建议章节,可以参考下。
我提几个思路:

1. 硬件算子是Conv + Relu + maxpooling 是一个硬件算子,所以yolo里所有LeaklyRelu改为 Relu可以大大提高推理速度。
2. 尽量用3x3卷积,能提高速度(所有卷积都是可以拆成若干个3x3卷积集合的)
3. 减小input尺寸大小。
4. 量化(已经量化就请忽略。)
5. 多个计算棒并行等等
回复

使用道具 举报

farces

新手上路

积分
48
QQ
板凳
 楼主| 发表于 2019-10-28 14:52:16 | 只看该作者
jefferyzhang 发表于 2019-10-28 14:25
差异肯定是存在的,这俩网络运算复杂度差异本身就很大。

在RKNN的转换文档里有网络优化设计建议章节,可以 ...

好的,我试试,这个RK3399pro的板子,多个计算棒的方式肯定行不通,也不适用于最终的生产环境。多谢
回复

使用道具 举报

jefferyzhang

版主

积分
12958
地板
发表于 2019-10-28 14:54:06 | 只看该作者
farces 发表于 2019-10-28 14:52
好的,我试试,这个RK3399pro的板子,多个计算棒的方式肯定行不通,也不适用于最终的生产环境。多谢 ...

嗯,你具体参看下文档,里头写了很多优化思路
回复

使用道具 举报

farces

新手上路

积分
48
QQ
5#
 楼主| 发表于 2019-10-28 15:09:50 | 只看该作者
jefferyzhang 发表于 2019-10-28 14:25
差异肯定是存在的,这俩网络运算复杂度差异本身就很大。

在RKNN的转换文档里有网络优化设计建议章节,可以 ...

是不是理解,芯片不支持LeaklyRelu,是通过cpu来计算这部分的?
回复

使用道具 举报

jefferyzhang

版主

积分
12958
6#
发表于 2019-10-28 15:18:08 | 只看该作者
farces 发表于 2019-10-28 15:09
是不是理解,芯片不支持LeaklyRelu,是通过cpu来计算这部分的?

不能算不支持吧,是 conv+relu+maxpooling 等于一个硬件OP,速度就会快很多
而 conv + leakyRelu + maxpool 会被拆成三个操作,效率就没那么高了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表