- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

自然语言工具包NLTK安装出现的问题及解决办法

滕云发表于 2020/03/27 00:25:25 2020/03/27

【摘要】 NLTK库是Python中最为常用的NLP（自然语言处理）工具，它提供了易于使用的接口，通过这些接口可以访问超过50个语料库和词汇资源（如WordNet），还有一套用于分类、标记化、词干标记、解析和语义推理的文本处理库，以及工业级NLP库的封装器和一个活跃的讨论论坛。接下来介绍一下windows环境下该库的安装方法以及碰到的坑。

NLTK库是Python中最为常用的NLP（自然语言处理）工具，它提供了易于使用的接口，通过这些接口可以访问超过50个语料库和词汇资源（如WordNet），还有一套用于分类、标记化、词干标记、解析和语义推理的文本处理库，以及工业级NLP库的封装器和一个活跃的讨论论坛。

接下来介绍一下windows环境下该库的安装方法以及我碰到的坑。

使用pip进行安装是最为方便的，在命令提示符中输入

pip install nltk

即可完成安装，在命令提示符中输入python进入解释器，输入如下代码：

import nltk

nltk.download( )

但在执行nltk.download()报错：[WinError 10054]远程主机强迫关闭了一个现有连接

解决方法：首先手动下载nltk数据集，

然后把下载好的压缩包解压至上图中的Download Directory目录下，每个人的机子这个地方可能不一样。

之后打开python命令行，输入from nltk.book import *，出现以下结果则说明安装成功：

到这里，说明nltk库已经安装好了，但是在编程测试的时候，仍然报错：

sentence = 'The brown fox is quick and he is jumping over the lazy dog'

import nltk

tokens = nltk.word_tokenize(sentence)

tagged_sent = nltk.pos_tag(tokens)

print(tagged_sent)

错误1：punkt没找到

解决方案：

1、打开路径：D:\nltk_data\tokenizers，发现有一个名为<punkt.zip>的压缩包；

2、选中该压缩包，解压到当前目录下

再次运行上述程序，又报错，错误为：D:\nltk_data\tokenizers\punkt\PY3\english.pickle没找到，

解决方案：

1、打开路径C:\Users\TY\AppData\Roaming\nltk_data\tokenizers\punkt，发现其实存在english.pickle

2、路径检索的时候多了个\PY3\，所以，在C:\Users\TY\AppData\Roaming\nltk_data\tokenizers\punkt 新建一下文件夹，命名为PY3，然后将文件english.pickle拷贝进去PY3文件夹下

再次运行程序，结果正确：

总结

如果在运行程序时，提示说没有找到某个文件，那么可以去该路径下查看，是否没有解压文件，或者路径不对。

按照提示路径创建文件即可。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

自然语言工具包NLTK安装出现的问题及解决办法

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品