《TensorFlow自然语言处理》—1.3.2 传统方法的缺点

举报
华章计算机 发表于 2019/07/20 22:02:07 2019/07/20
【摘要】 本节书摘来自华章计算机《TensorFlow自然语言处理》一书中的第1章,第1.3.2节,[澳] 图珊·加内格达拉(Thushan Ganegedara) 著 马恩驰 陆 健 译。

1.3.2 传统方法的缺点

让我们列出传统方法的几个主要缺点,因为这将为讨论为什么需要深度学习奠定良好的基础:

  • 传统NLP中使用的预处理步骤迫使我们对文本中嵌入的潜在有用信息(例如,标点符号和时态信息)进行取舍权衡,以便通过减少词汇量来使学习成为可能。尽管在现代的基于深度学习的解决方案中我们仍然会使用预处理,但由于深度网络具有较大的表征容量,因此预处理并不像在传统的NLP流程中那样重要。

  • 需要人工手动设计特征工程。为了设计可靠的系统,需要设计好的特征。由于需要广泛探索不同的特征空间,因此这个过程非常烦琐。此外,为了有效地探索强大的特征,需要领域专业知识,这对于某些NLP任务来说是缺乏的。

  • 传统方法需要各种外部资源才能表现良好,并且没有多少免费提供的资源。这样的外部资源通常包括存储在大型数据库中的人工创建的信息。为特定任务创建资源可能需要几年时间,具体取决于任务的严格性(例如,机器翻译规则库)。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。