《TensorFlow自然语言处理》—1.3.2　传统方法的缺点

华章计算机发表于 2019/07/20 22:02:07 2019/07/20

【摘要】本节书摘来自华章计算机《TensorFlow自然语言处理》一书中的第1章，第1.3.2节，［澳］　图珊·加内格达拉（Thushan Ganegedara）　著马恩驰　陆　健　译。

让我们列出传统方法的几个主要缺点，因为这将为讨论为什么需要深度学习奠定良好的基础：

传统NLP中使用的预处理步骤迫使我们对文本中嵌入的潜在有用信息（例如，标点符号和时态信息）进行取舍权衡，以便通过减少词汇量来使学习成为可能。尽管在现代的基于深度学习的解决方案中我们仍然会使用预处理，但由于深度网络具有较大的表征容量，因此预处理并不像在传统的NLP流程中那样重要。
需要人工手动设计特征工程。为了设计可靠的系统，需要设计好的特征。由于需要广泛探索不同的特征空间，因此这个过程非常烦琐。此外，为了有效地探索强大的特征，需要领域专业知识，这对于某些NLP任务来说是缺乏的。
传统方法需要各种外部资源才能表现良好，并且没有多少免费提供的资源。这样的外部资源通常包括存储在大型数据库中的人工创建的信息。为特定任务创建资源可能需要几年时间，具体取决于任务的严格性（例如，机器翻译规则库）。

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

上滑加载中

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。