|
现将姿态检测算法移植到RK3399Pro开发板上,该算法由两个子模块组成:“人体检测模型yolov3”和“单人姿态检测模型”。算法大致原理是先使用yolov3将输入图像中的人体都检测出来,然后将检测出的人体裁剪出来,一个个送进“单人姿态检测模型”检测关节点位置。
原算法运行在pc上,主要通过多线程(两个模型同时在运行)+大batchsize(yolo的batchsize=5,单人姿态检测模型的batchsize=60)提高fps。
我目前的程序未使用任何优化,按上面将的流程,从头到尾进行处理。想问下如果想在不对模型进行量化的情况下,如何通过优化程序,来提高fps。
如:
1. 能否通过使用多线程,使得两个模型同时在npu上运行,以提高fps;
2. 如何增大batchsize,使得模型一次推理多张图,以提高fps。
|
|