- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【第17篇】TextCNN

AI浩发表于 2021/12/23 01:43:39 2021/12/23

【摘要】摘要我们报告了在预训练词向量之上训练的卷积神经网络 (CNN) 的一系列实验，用于句子级分类任务。我们表明，具有很少超参数调整和静态向量的简单 CNN 在多个基准测试中取得了出色的结果。通过微调学...

摘要

我们报告了在预训练词向量之上训练的卷积神经网络 (CNN) 的一系列实验，用于句子级分类任务。我们表明，具有很少超参数调整和静态向量的简单 CNN 在多个基准测试中取得了出色的结果。通过微调学习特定于任务的向量可进一步提高性能。我们还建议对架构进行简单的修改，以允许使用特定于任务的向量和静态向量。此处讨论的 CNN 模型在 7 个任务中的 4 个任务上改进了现有技术，其中包括情感分析和问题分类。

1 简介

近年来，深度学习模型在计算机视觉（Krizhevsky 等，2012）和语音识别（Graves 等，2013）方面取得了显著成果。在自然语言处理中，深度学习方法的大部分工作都涉及通过神经语言模型学习词向量表示（Bengio 等人，2003 年；Yih 等人，2011 年；Mikolov 等人，2013 年）并在学习用于分类的词向量（Collobert et al., 2011）。单词向量，其中单词从稀疏的 1-of-V 编码（这里 V 是词汇量大小）通过隐藏层投影到较低维度的向量空间，本质上是特征提取器，在它们的维度上对单词的语义特征进行编码。在这样的密集表示中，语义接近的词在低维向量空间中同样接近 - 在欧几里得或余弦距离上。

卷积神经网络 (CNN) 使用带有卷积过滤器的层，这些过滤器应用于局部特征（LeCun 等人，1998 年）。 CNN 模型最初是为计算机视觉而发明的，后来被证明对 NLP 有效，并在语义解析（Yih 等人，2014 年）、搜索查询检索（Shen 等人，2

文章来源: wanghao.blog.csdn.net，作者：AI浩，版权归原作者所有，如需转载，请联系作者。

原文链接：wanghao.blog.csdn.net/article/details/120729088

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【第17篇】TextCNN

摘要

1 简介

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

【第17篇】TextCNN

摘要

1 简介

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品