Toybrick

模型中Transpose运行耗时的问题

lrzss

注册会员

积分
150
楼主
发表于 2024-12-30 10:44:39    查看: 443|回复: 3 | [复制链接]    打印 | 只看该作者
您好,下面的图是我的模型,转为rknn模型后,使用eval_perf,进行模型性能评估后的结果,其中Transpose的时间占了61.22%,而且是在cpu上运行了,请问下怎么降低Transpose这部分的耗时?


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

jefferyzhang

版主

积分
13714
沙发
发表于 2024-12-30 15:43:36 | 只看该作者
这只能改模型,transpose转置在pc上也是非常慢的动作,改了对pc推理和npu推理都有很大速度提升。
先理解模型为什么有transpose,他在做什么,然后再思考能不能改掉他
回复

使用道具 举报

lrzss

注册会员

积分
150
板凳
 楼主| 发表于 2024-12-31 17:05:07 | 只看该作者
好的......
回复

使用道具 举报

piccolo

中级会员

积分
325
地板
发表于 2025-1-2 11:29:57 | 只看该作者
transpose是不是指的是nhwc转为nchw?转换模型的时候可以试试设置force_builtin_perm,将转换放在npu里面做
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表