leakyRelu这个操作

[复制链接] · 发表于 2019-11-28 15:50:52

yolov3和tiny-yolov3 里面的卷积的激活函数就是 leakyRelu ,基于darknet的话转模型没问题，但是基于keras的话，就不识别 leakyRelu 这个OP了，为啥会有这样的差异呢

只看该作者 · 发表于 2019-11-29 09:08:13

这个主要是因为tf会将很多OP给组合起来变成子图，造成本来可以识别的op被封装了一层就无法识别了。
并且硬件OP和软件OP并不是一一对应的，例如我们硬件会将 Conv2D-Relu-Maxpooling合成一个OP，效率很快。
有几种方案你可以试下：
1. keras转tf后，可以用remove traning nodes指令拆散子图结构，可以尝试下
2. 其实这里不建议用LeakyRelu，因为这个在硬件上是单独一个OP，如果你改成Relu，会被硬件三合一为一个OP，极大提高效率
3. 试着改下leakyRelu前后的op，尽量减少矩阵操作add、sub、div、mul之类的单独操作。

只看该作者 · 发表于 2019-11-29 10:16:26

jefferyzhang 发表于 2019-11-29 09:08
这个主要是因为tf会将很多OP给组合起来变成子图，造成本来可以识别的op被封装了一层就无法识别了。
并且硬 ...

sounds great,thanks