Toybrick

标题: RK3399Pro 号称支持3TOPS的算力是怎么计算出来的? [打印本页]

作者: chenshq168    时间: 2021-6-17 16:26
标题: RK3399Pro 号称支持3TOPS的算力是怎么计算出来的?
RK3399Pro AI 峰值算力能达到3TOPS,这个算力是怎么计算出来的?是通过工具计算的还是自己编程计算的?有没有方法可以方便的计算出来?谢谢!

作者: jefferyzhang    时间: 2021-6-17 16:39
1920个INT8 MAC计算单元, 乘以 800MHz NPU频率, 每个MAC能同时做乘和加两个操作,所以再乘以2.
最后算力等于  1920x800MHz*2 = 3.072TOps
作者: chenshq168    时间: 2021-6-18 08:31
非常感谢超级版主的回复,
我的想法是我们能不能跑一个网络模型或者写个程序在npu上面跑,然后去计算出来的值会不会跟官方的数据相吻合呢?
让我们的用户能够很直观的明白npu的算力峰值确确实实能达到3TOPS。
作者: jefferyzhang    时间: 2021-6-18 08:41
chenshq168 发表于 2021-6-18 08:31
非常感谢超级版主的回复,
我的想法是我们能不能跑一个网络模型或者写个程序在npu上面跑,然后去计算出来的 ...

如果你能自己编写一个网络,完全利用到1920个MAC单元,那是可以的。但我们没有提供这种网络。
需要直观数据直接google就好了,国内外很多人对各大厂家NPU的经典模型进行过评测。
作者: chenshq168    时间: 2021-6-18 09:10
本帖最后由 chenshq168 于 2021-6-18 09:11 编辑

非常感谢jefferyzhang版主的耐心解答,
版主能不能介绍一下,哪些经典的模型是可以在RK3399Proc上直接进行评测的?
因为我使用rknn-toolkit-v1.6里面的example网络模型在开发板上进行测试的时候,发现有相当一部分网络模型跑不起来。

作者: jefferyzhang    时间: 2021-6-18 15:20
chenshq168 发表于 2021-6-18 09:10
非常感谢jefferyzhang版主的耐心解答,
版主能不能介绍一下,哪些经典的模型是可以在RK3399Proc上直接进行 ...

1. 绝大多数模型都可以跑,跑不了的请参看文档debug下或者加入rknnqq群跟其他人讨论下。
2. google上搜人家评测,人家能评测的说明人家都已经转换过来了
3. 跑不起来的网络一般是带有较新op的,需要修改或者自定义op




欢迎光临 Toybrick (https://t.rock-chips.com/) Powered by Discuz! X3.3