Tensorflow中实现leakyRelu

举报
风吹稻花香 发表于 2021/06/04 23:09:30 2021/06/04
3.2k+ 0 0
【摘要】 ReLU、LeakyReLU ReLU作为激活函数被广泛应用于各种深度神经网络中。在这篇博客中,我主要记录一下它和它的变种在caffe中的实现。 先看下来自wikipedia的一张示意图,图中蓝色的线表示的就是ReLU函数。  ReLU激活函数极为。而LeakyReLU则是其变体,其中,是一个小的非零数。 综上,在caffe中,ReL...


ReLU、LeakyReLU

ReLU作为激活函数被广泛应用于各种深度神经网络中。在这篇博客中,我主要记录一下它和它的变种在caffe中的实现。 
先看下来自wikipedia的一张示意图,图中蓝色的线表示的就是ReLU函数。 
ReLU 
ReLU激活函数极为。而LeakyReLU则是其变体,其中,是一个小的非零数。

综上,在caffe中,ReLU和LeakyReLU都包含在relu_layer中。 
在后向传播过程中,ReLU做如下运算: 


而变体的LeakyReLU则做: 

接下来,我们来看看ReLU层的参数。


       // Message that stores parameters used by ReLULayer
       message ReLUParameter {
        // Allow non-zero slope for negative inputs to speed up optimization
        // Described in:
        // Maas, A. L., Hannun, A. Y., & Ng, A. Y. (2013). Rectifier nonlinearities
        // improve neural network acoustic models. In ICML Workshop on Deep Learning
        // for Audio, Speech, and Language Processing.
         optional float negative_slope = 1 [default = 0]; //如之前分析的,默认值0即为ReLU,非零则为LeakyReLU
        enum Engine {
        DEFAULT = 0;
        CAFFE = 1;
        CUDNN = 2;
         }
         optional Engine engine = 2 [default = DEFAULT]; //运算引擎选择,一般选择默认
       }
   
  
  

PReLU

PReLU,即Parametric ReLU,是何凯明组提出的一种改进ReLU。它的数学表示为 ,其中是可学习参数。当为固定的非零较小数时,它等价于LeakyReLU;当它为0时,PReLU等价于ReLU。它的后向传播进行如下计算: 


参数 的更新公式如下: 

PReLU的实现不包含在ReLU中,主要是有可学习参数 ,它的实现包含在prelu_layer中。


       message PReLUParameter {
        // Parametric ReLU described in K. He et al, Delving Deep into Rectifiers:
        // Surpassing Human-Level Performance on ImageNet Classification, 2015.
        // Initial value of a_i. Default is a_i=0.25 for all i.
         optional FillerParameter filler = 1;  //默认填充,a_i的初始值为0.25
        // Whether or not slope parameters are shared across channels.
         optional bool channel_shared = 2 [default = false]; //是否通道共享参数,默认为不共享
       }
   
  
  


Tensorflow中实现leakyRelu操作(高效)

从github上转来,实在是厉害的想法,什么时候自己也能写出这种精妙的代码就好了 
原地址: 
简易高效的LeakyReLu实现

代码如下: 我做了些改进,因为实在tensorflow中使用,就将原来的abs()函数替换成了tf.abs()

import tensorflow as tfdef LeakyRelu(x, leak=0.2, name="LeakyRelu"): with tf.variable_scope(name): f1 = 0.5 * (1 + leak) f2 = 0.5 * (1 - leak) return f1 * x + f2 * tf.abs(x) # 这里和原文有不一样的,我没试验过原文的代码,但tf.abs()肯定是对的

文章来源: blog.csdn.net,作者:网奇,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/jacke121/article/details/80568520

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。