Toybrick

在rk3588上为什么有些reshape是在CPU上计算,而不是在NPU上计算

11111qq

注册会员

积分
104
楼主
发表于 7 天前    查看: 119|回复: 0 | [复制链接]    打印 | 只看该作者
本帖最后由 11111qq 于 2025-12-9 16:44 编辑

我转了一个rknn模型,有5路的reshape结构,这5路的模型结构是一样的,其中一路的reshape输入是(1x256x100x100),我用rknn.eval_perf()查看这一路的reshape是在NPU上运行的,但是其他4路却是在CPU上运行的,模型结构是一样的,但是其他4路的reshape输入不一样,其他4路的输入分别是:(1x256x50x50),(1x256x25x25),(1x256x13x13),(1x256x7x7),在CPU上运行。是不是算子的输入shape会影响它调用的硬件,什么尺寸的输入数据会在NPU上计算,这个有具体的范围吗?
如果我想把这5路的reshape算子都放到NPU上计算,需要使用什么方法?怎么去修改模型?




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表