|
在python环境下,多线程跑多个模型.比如: thread1 -> model1(模型大小100M,推断时间t1), thread2 -> model2(模型大小50M,推断时间t2), thread3 -> model3(模型大小10M,推断时间t3).
测试:
1, 单线程任意跑单个模型,耗费时间正常, t1>t2>t3;
2, 2线程跑任意两个模型,耗费时间不正常, t1=t2或者t1=t3或者t2=t3;
3, 3线程跑3模型,耗费时间不正常, t1=t2=t3;
补充: 如果将model1使用batch推断,那么model2和model3也会拉的和model1推断的时间一样长.
我想问下,在使用多线程推断的时候,rknn内部是否是将图片统一对齐后统一推断统一返回呢,而不是单独分ctx各自工作的.
|
|