|
看到版主说到瑞芯微的NPU采用多线程推理可以提高推理速度,但本质NPU是分时复用系统,谁抢到时间片就先跑谁,我有个疑问想请版主解释一下,既然是分时复用,那么如果输入都采用零内存拷贝技术,那么使用一个线程对视频推理,和采用多个线程处理视频推理,节省的是什么时间?按理说应该用时是相同的,不甚理解,请版主解惑。
另外,多线程推理技术,会不会对系统造成一个固定的整体延时?也就是说,假设多线程推理模型的时间是20ms(50帧/s),0时刻开始,按照顺序输入视频帧 ,帧率是30帧/s(推理速度大于帧率),输出端是可以达到实时处理,但是是否有一个整体延时,也就是说必须在100ms(假设)后才能够拿到第一帧的推理结果,之后才能每20ms拿到推理结果?请版主答疑解惑,多谢多谢!!!!
|
|