Toybrick

RKNN内存分配与I/O时间疑问

longsheng

新手上路

积分
38
楼主
发表于 2019-6-6 19:09:39    查看: 7314|回复: 4 | [复制链接]    打印 | 只看该作者
1. 调用内存查询可以看到网络所用内存,NPU memory 和 System memory是独立还是共用?大小是否可调?======================================================
            Memory Profile Info Dump                  
======================================================
System memory:
    maximum allocation : 167.06 MiB
    total allocation   : 184.52 MiB
NPU memory:
    maximum allocation : 38.08 MiB
    total allocation   : 48.97 MiB

Total memory:
    maximum allocation : 205.14 MiB
    total allocation   : 233.50 MiB

INFO: When evaluating memory usage, we need consider  
the size of model, current model size is: 6.62 MiB      
======================================================


2. 对8-bit量化caffe检测model进行C++实验得到1000帧处理时间的平均值

    1) `rknn_inputs_set` : 5.6ms
    2) `rknn_run` : 0.6ms
    3) `rknn_outputs_get` : 8.7ms

用RKNN_QUERY_PERF_RUN得到其中网络运行时间为1.8ms,那么rknn_outputs_get内部还做了什么工作?rknn_inputs_set内部做了什么工作?

回复

使用道具 举报

jefferyzhang

版主

积分
13003
沙发
发表于 2019-6-10 09:04:35 | 只看该作者
非公用,NPU有自己独立的2G的DDR
回复

使用道具 举报

longsheng

新手上路

积分
38
板凳
 楼主| 发表于 2019-6-10 14:46:29 | 只看该作者
jefferyzhang 发表于 2019-6-10 09:04
非公用,NPU有自己独立的2G的DDR

对8-bit量化caffe检测model进行C++实验得到1000帧处理时间的平均值. 用RKNN_QUERY_PERF_RUN得到其中网络运行时间为1.8ms, 那么rknn_outputs_get 8.7ms内部还做了什么工作?rknn_inputs_set 5.6ms内部做了什么工作?
回复

使用道具 举报

jefferyzhang

版主

积分
13003
地板
发表于 2019-6-10 16:39:04 | 只看该作者
longsheng 发表于 2019-6-10 14:46
对8-bit量化caffe检测model进行C++实验得到1000帧处理时间的平均值. 用RKNN_QUERY_PERF_RUN得到其中网络 ...

从NPU到3399 DDR的时间,和从3399DDR到NPU的时间。
这和GPU独显原理是一样的,有个数据交互的拷贝过程。
回复

使用道具 举报

ldol31627

中级会员

积分
310
5#
发表于 2019-8-13 12:46:09 | 只看该作者
请问Memory Profile Info Dump是如何调出来的?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表