Toybrick

RGA图像处理对比Opencv慢10倍,是什么问题?

jefferyzhang

版主

积分
12973
楼主
发表于 2024-3-29 09:15:08 | 显示全部楼层
硬件算法仅对Non-Cache的物理连续Buffer友好。
这种CPU从MMU申请的非连续还带Cache的buffer,同步cache以及频繁的mmu访问都是速度低下的原因。
回复

使用道具 举报

jefferyzhang

版主

积分
12973
沙发
发表于 2024-3-29 16:34:28 | 显示全部楼层
萌虎龟来 发表于 2024-3-29 10:34
你好,针对你的建议,我的理解是:
1. 带Cache的buffer,意思是需要将DMA_HEAP_PATH修改为DMA_HEAP_UNCACHE ...

1. 改用CMA
2. 不用cache就不存在同步
3. CMA物理连续,使用物理地址不需要访问mmu
4. 对其可以用RGA Crop
5. 代码里存在memcpy就是有问题的写法,要从架构设计上进出buf就得是dma/cma ,如果你想cpu读一个图再用rga,那是无意义的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表