《智能系统与技术丛书 深度学习实践:基于Caffe的解析》—3.3Caffe训练需要的几个部件

举报
华章计算机 发表于 2019/06/02 16:06:29 2019/06/02
【摘要】 本书摘自《智能系统与技术丛书 深度学习实践:基于Caffe的解析》一文中的第3章,第3.3.1节,作者是薛云峰。

3.3 Caffe训练需要的几个部件

       Caffe训练一个网络除了需要刚才处理的输入数据库之外,还需要构建网络proto文件和优化proto文件,接下来本书将对此进行详细介绍,下面先从网络proto文件的编写开始进行吧。

3.3.1 网络proto文件的编写

        对于基本层的编写,本节将以卷积层进行示例说明。

        name:“conv1”,表示层的名字是conv1。

        type:“Convolution”,表示这个层的类型是Convolution。

        bottom:“data”,表示输入数据从存储结构data中获得。

        top:“convl”,表示输出结果的数据保存到存储结构convl中。

        param中的内容是所有层共用的内容{},其中,lr_mult表示本层参数的学习率需要乘上的一个系数。它与学习率(base_lr)一起决定了层参数的更新系数。

        convolution_param这个参数是可选的,不同的层其参数也不一样,这个将在后面进行详细介绍。

layer {

  name: "conv1"

  type: "Convolution"

  bottom: "data"

  top: "conv1"

  param {

    lr_mult: 1

  }

  convolution_param {

    num_output: 32

    pad: 2

    kernel_size: 5

    stride: 1

    bias_term: false

    weight_filler {

      type: "gaussian"

      std: 0.0001

    }

  }

}


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。