|
|
本帖最后由 11111qq 于 2025-12-9 16:44 编辑
我转了一个rknn模型,有5路的reshape结构,这5路的模型结构是一样的,其中一路的reshape输入是(1x256x100x100),我用rknn.eval_perf()查看这一路的reshape是在NPU上运行的,但是其他4路却是在CPU上运行的,模型结构是一样的,但是其他4路的reshape输入不一样,其他4路的输入分别是:(1x256x50x50),(1x256x25x25),(1x256x13x13),(1x256x7x7),在CPU上运行。是不是算子的输入shape会影响它调用的硬件,什么尺寸的输入数据会在NPU上计算,这个有具体的范围吗?
如果我想把这5路的reshape算子都放到NPU上计算,需要使用什么方法?怎么去修改模型?
|
|