Toybrick

RK3399Pro 号称支持3TOPS的算力是怎么计算出来的?

chenshq168

注册会员

积分
105
楼主
发表于 2021-6-17 16:26:11    查看: 15495|回复: 5 | [复制链接]    打印 | 只看该作者
RK3399Pro AI 峰值算力能达到3TOPS,这个算力是怎么计算出来的?是通过工具计算的还是自己编程计算的?有没有方法可以方便的计算出来?谢谢!
回复

使用道具 举报

jefferyzhang

版主

积分
13572
沙发
发表于 2021-6-17 16:39:32 | 只看该作者
1920个INT8 MAC计算单元, 乘以 800MHz NPU频率, 每个MAC能同时做乘和加两个操作,所以再乘以2.
最后算力等于  1920x800MHz*2 = 3.072TOps
回复

使用道具 举报

chenshq168

注册会员

积分
105
板凳
 楼主| 发表于 2021-6-18 08:31:59 | 只看该作者
非常感谢超级版主的回复,
我的想法是我们能不能跑一个网络模型或者写个程序在npu上面跑,然后去计算出来的值会不会跟官方的数据相吻合呢?
让我们的用户能够很直观的明白npu的算力峰值确确实实能达到3TOPS。
回复

使用道具 举报

jefferyzhang

版主

积分
13572
地板
发表于 2021-6-18 08:41:11 | 只看该作者
chenshq168 发表于 2021-6-18 08:31
非常感谢超级版主的回复,
我的想法是我们能不能跑一个网络模型或者写个程序在npu上面跑,然后去计算出来的 ...

如果你能自己编写一个网络,完全利用到1920个MAC单元,那是可以的。但我们没有提供这种网络。
需要直观数据直接google就好了,国内外很多人对各大厂家NPU的经典模型进行过评测。
回复

使用道具 举报

chenshq168

注册会员

积分
105
5#
 楼主| 发表于 2021-6-18 09:10:30 | 只看该作者
本帖最后由 chenshq168 于 2021-6-18 09:11 编辑

非常感谢jefferyzhang版主的耐心解答,
版主能不能介绍一下,哪些经典的模型是可以在RK3399Proc上直接进行评测的?
因为我使用rknn-toolkit-v1.6里面的example网络模型在开发板上进行测试的时候,发现有相当一部分网络模型跑不起来。
回复

使用道具 举报

jefferyzhang

版主

积分
13572
6#
发表于 2021-6-18 15:20:53 | 只看该作者
chenshq168 发表于 2021-6-18 09:10
非常感谢jefferyzhang版主的耐心解答,
版主能不能介绍一下,哪些经典的模型是可以在RK3399Proc上直接进行 ...

1. 绝大多数模型都可以跑,跑不了的请参看文档debug下或者加入rknnqq群跟其他人讨论下。
2. google上搜人家评测,人家能评测的说明人家都已经转换过来了
3. 跑不起来的网络一般是带有较新op的,需要修改或者自定义op
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

产品中心 购买渠道 开源社区 Wiki教程 资料下载 关于Toybrick


快速回复 返回顶部 返回列表