- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

深度学习核心技术精讲100篇（十一）-Google利器超强特征提取网络（Transformer）

格图洛书发表于 2021/11/19 00:15:53 2021/11/19

【摘要】前言谷歌于2017年提出 Transformer网络架构，此网络一经推出就引爆学术界。目前，在NLP领域，Transformer模型被认为是比CNN，RNN都要更强的特征提取器。 Transformer算法简介 Transformer引入了self-attention机制，同时还借鉴了CNN领域中残差机制（Residuals），...

前言

谷歌于2017年提出 Transformer网络架构，此网络一经推出就引爆学术界。目前，在NLP领域，Transformer模型被认为是比CNN，RNN都要更强的特征提取器。

Transformer算法简介

Transformer引入了self-attention机制，同时还借鉴了CNN领域中残差机制（Residuals），由于以上原因导致transformer有如下优势：

模型表达能力较强，由于self-attention机制考虑到了句子之中词与词之间的关联，
抛弃了RNN的循环结构，同时借用了CNN中的残差结构加快了模型的训练速度。

接下来我们来看看transformer的一些细节：

首先Scaled Dot-Product Attention步骤是transformer的精髓所在，作者引入Q，W，V参数通过点乘相识度去计算句子中词与词之间的关联重要程度。其大致过程如图所示，博主将会在实战部分具体介绍此过程如何实现。

Scaled Dot-Product Attention
第二个是muti-head步骤，直白的解释就是将上面

文章来源: wenyusuran.blog.csdn.net，作者：文宇肃然，版权归原作者所有，如需转载，请联系作者。

原文链接：wenyusuran.blog.csdn.net/article/details/107333458

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

深度学习核心技术精讲100篇（十一）-Google利器超强特征提取网络（Transformer）

前言

Transformer算法简介

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

深度学习核心技术精讲100篇（十一）-Google利器超强特征提取网络（Transformer）

前言

Transformer算法简介

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品