《TensorFlow自然语言处理》—1.3.2 传统方法的缺点
【摘要】 本节书摘来自华章计算机《TensorFlow自然语言处理》一书中的第1章,第1.3.2节,[澳] 图珊·加内格达拉(Thushan Ganegedara) 著 马恩驰 陆 健 译。
1.3.2 传统方法的缺点
让我们列出传统方法的几个主要缺点,因为这将为讨论为什么需要深度学习奠定良好的基础:
传统NLP中使用的预处理步骤迫使我们对文本中嵌入的潜在有用信息(例如,标点符号和时态信息)进行取舍权衡,以便通过减少词汇量来使学习成为可能。尽管在现代的基于深度学习的解决方案中我们仍然会使用预处理,但由于深度网络具有较大的表征容量,因此预处理并不像在传统的NLP流程中那样重要。
需要人工手动设计特征工程。为了设计可靠的系统,需要设计好的特征。由于需要广泛探索不同的特征空间,因此这个过程非常烦琐。此外,为了有效地探索强大的特征,需要领域专业知识,这对于某些NLP任务来说是缺乏的。
传统方法需要各种外部资源才能表现良好,并且没有多少免费提供的资源。这样的外部资源通常包括存储在大型数据库中的人工创建的信息。为特定任务创建资源可能需要几年时间,具体取决于任务的严格性(例如,机器翻译规则库)。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)