Toybrick
标题:
板子评估时间和实际运行时间差别很大。
[打印本页]
作者:
xiaqing10
时间:
2020-6-9 11:28
标题:
板子评估时间和实际运行时间差别很大。
本帖最后由 xiaqing10 于 2020-6-9 11:59 编辑
环境:
TB-RK3399Pro Debian10 python3 rknn1.3.2
模型对比,
前者是评估
的fps,
后者是实际运行
的fps
ssd_mobilenet_v1: 77 28
ssd_inception_v2: 59 29
mobilenet_v1: 195 50
vgg(16): 64 43
yolo3_tiny: 147 50
model1(自己搭建的一个小网络): 140 47
model2(自己搭建的一个大网络,rknn大小50M) 24 17
model3(裁剪model2,rknn大小28M): 38 22
model3_batch2 (model3的batch方式) 18 12
我的理解是,虽然eval的是推断时间,没有数据换入换出,但是理论上差别应该不是很大,如果差别很大,那么这个数据置换就是整个模型的瓶颈。
所以当自己的模型很小,eval很快,但是存在了数据的传输,最多也只能跑50fps(参考mobilenet_v1,yolo3_tiny)。 请问这个该怎么优化呢?另补充下,采用batch推断的方式也没有提高速度,参考model3_batch2
作者:
xiaqing10
时间:
2020-6-9 15:13
模型对比,前者是评估的fps,后者是实际运行的fps
vgg(16): 64 61
yolo3_tiny: 147 115
model2(自己搭建的一个大网络,rknn大小50M) 24 22
model3(裁剪model2,rknn大小28M): 38 37
model3_batch2 (model3的batch方式) 18 17
更正下,采用了异步模式后确认速度正常。是我没仔细看文档的问题
欢迎光临 Toybrick (https://t.rock-chips.com/)
Powered by Discuz! X3.3