Toybrick
标题:
零拷贝推理速度和结果异常
[打印本页]
作者:
学校对面
时间:
2024-5-24 17:50
标题:
零拷贝推理速度和结果异常
我的量化模型使用通用API时,推理时间大概在14ms,但是上下文传输时数据拷贝也差不多有10ms,因此想用零拷贝来做。
我目前是通过opencv读取图像后,再使用memcpy将img.data给inputs.men[0]->logical_addr,设备是rv1126。但是目前遇到了两个问题:
(1):如果我每一次拷贝数据时都使用rknn_set_io_mem(看文档是不需要的,仅首次设置即可),推理时间会变得特别长(15s);即便是仅设置一次的情况下,第一帧的推理时长也会到15s
(2):推理结果从outputs_mem[0]->logical_addr中拿出来时,结果全为0
请问产生这种现象的原因可能有哪些楠?网上找了很久都没找到类似的现象。。
谢谢!
作者:
ggbond
时间:
2024-8-14 10:01
用外部的空间就要每次都rknn_set_io_mem ,不然每次都要把数据拷贝进来 我也遇到了这个问题. 用rknn_query查询 告诉我只用了15ms 但我时间测出来是150ms 不知道其中做了什么。我用他零拷贝demo里的模型就是没有这个问题 加载自己的模型就遇到了,还有就是rknn_set_io_mem本身的耗时问题,综合下来还不如我自己拷贝的时间短
欢迎光临 Toybrick (https://t.rock-chips.com/)
Powered by Discuz! X3.3