Toybrick

在rk3399pro上使用rknn的接口rknn_init内部概率性崩溃!!!

panziwen86

注册会员

积分
53
楼主
发表于 2020-6-5 10:44:48    查看: 54043|回复: 32 | [复制链接]    打印 | 只看该作者
因为在项目中发现rknn_init接口出错然后引起程序直接崩溃,然后更换很多个模型,升级rknn_api发现都有这个问题,然后直接用官方提供的rknn_apiSDK中提供的rknn_ssd.cpp,稍微修改,多进程反复使用rknn_init初始化模型,发现也有此问题,而且时间长了npu_transfer_proxy这个npu的服务也会崩溃,而且有时候一个进程在调用rknn_api时出错或者崩溃了,会影响其他使用rknn_api的进程,不管是rknn_api调用崩溃,还是npu_transfer_proxy崩溃,都必须重启系统才能恢复,这在线上是一个非常严的问题,希望官网能及时解决,下面附件中是我修改的测试用例,和崩溃现象图片。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

jefferyzhang

版主

积分
13580
沙发
发表于 2020-6-5 11:00:51 | 只看该作者
1. 什么板子
2. 什么固件
3. 什么系统
回复

使用道具 举报

panziwen86

注册会员

积分
53
板凳
 楼主| 发表于 2020-6-5 13:17:39 | 只看该作者
jefferyzhang 发表于 2020-6-5 11:00
1. 什么板子
2. 什么固件
3. 什么系统

您好,板子是TB-96AI Debian10固件v1.0-20191126
回复

使用道具 举报

leok

版主

积分
894
地板
发表于 2020-6-5 14:43:31 | 只看该作者
升级完rknn,主机需要重启,或者先卸载旧rknn再升级新rknn,保证npu_transfer_proxy是新的,同时npu_transfer_proxy进程需要重启。

有按以上操作吗?
回复

使用道具 举报

panziwen86

注册会员

积分
53
5#
 楼主| 发表于 2020-6-5 15:40:01 | 只看该作者
leok 发表于 2020-6-5 14:43
升级完rknn,主机需要重启,或者先卸载旧rknn再升级新rknn,保证npu_transfer_proxy是新的,同时npu_transf ...

您好,应该都是最新的:
npu_transfer_proxy:
I NPUTransfer: Starting NPU Transfer Proxy, Transfer version 2.0.0 (8f9ebbc@2020-04-03T09:12:43)
rknn_api:
D RKNNAPI: RKNN VERSION:
D RKNNAPI:   API: 1.3.2 (9eebd73 build: 2020-04-02 14:54:02)
D RKNNAPI:   DRV: 1.3.1 (6ebb4d7 build: 2020-01-02 09:37:58)
我主机重启过,也是一样的问题。我现在大概是四个进程测试,跑几个小时,npu_transfer_proxy这个进程就不见了。。。
回复

使用道具 举报

leok

版主

积分
894
6#
发表于 2020-6-5 15:59:31 | 只看该作者
panziwen86 发表于 2020-6-5 15:40
您好,应该都是最新的:
npu_transfer_proxy:
I NPUTransfer: Starting NPU Transfer Proxy, Transfer ve ...

1、首先查看下内存;
2、尝试一个进程验证是否也有同样问题;
回复

使用道具 举报

chenxiao1116

新手上路

积分
30
7#
发表于 2020-6-6 23:07:09 | 只看该作者
我们用的时候也有类似问题;
RK方案稳定性确实不怎么样
回复

使用道具 举报

leok

版主

积分
894
8#
发表于 2020-6-7 11:10:21 | 只看该作者
chenxiao1116 发表于 2020-6-6 23:07
我们用的时候也有类似问题;
RK方案稳定性确实不怎么样

如遇见问题可以开帖,把问题列出来。并把信息提供全。 提供复现脚本。
回复

使用道具 举报

iamher0

注册会员

积分
111
9#
发表于 2020-6-8 08:56:16 | 只看该作者
我也遇到过这个问题,4路视频,每路3-4个模型,重启程序的时候很容易出现这个问题
复现步骤:多进程loop{rknn_init,inference n time,rknn_destory}

题主发的复现代码就可以
回复

使用道具 举报

panziwen86

注册会员

积分
53
10#
 楼主| 发表于 2020-6-8 09:40:09 | 只看该作者
leok 发表于 2020-6-5 15:59
1、首先查看下内存;
2、尝试一个进程验证是否也有同样问题;

你好,查看了内存没有异常,一个进程测试验证,发现也有问题,只是发生的时间可能长点,
上周五开始测试,周一过来发现测试进程崩溃了,但npu_transfer_proxy这个进程还在,重启测试
进程发现直接崩溃在rknn_init接口里了,然后重启npu_transfer_proxy,再启动测试进程,发现
还是有问题,rknn_init接口一直报错,只能重启系统才能恢复正常了,测试程序崩溃日志已上传
附件中,测试程序代码就是之前上传的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表