Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略

举报
一个处女座的程序猿 发表于 2021/03/28 02:07:01 2021/03/28
【摘要】 Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略         目录 nltk包的简介 nltk包的安装 nltk包的使用方法 nltk包的代码实现           nltk包的简介        NLTK is a leading platform for building Python programs to w...

Py之nltk:nltk包的简介、安装、使用方法、代码实现之详细攻略

 

 

 

 

目录

nltk包的简介

nltk包的安装

nltk包的使用方法

nltk包的代码实现


 

 

 

 

 

nltk包的简介

       NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, wrappers for industrial-strength NLP libraries, and an active discussion forum.

       NLTK是构建用于处理人类语言数据的Python程序的领先平台。它为超过50个语料库和词汇资源(如WordNet)提供了易于使用的界面,以及一套用于分类、标记化技术、词干、标记、解析和语义推理的文本处理库、工业级NLP库的包装器以及一个活跃的讨论论坛。

       用Python进行自然语言处理为语言处理的编程提供了一个实用的介绍。它由NLTK的创建者编写,指导读者完成编写python程序、使用语料库、对文本进行分类、分析语言结构等的基础知识。这本书的在线版本已经为python 3和nltk 3进行了更新。

      自然语言工具包(NLTK)是用于自然语言处理的Python包。NLTK需要python 2.7、3.4、3.5、3.6或3.7。

      NLTK(Natural Language ToolKit),是时下非常流行的在Python解释器环境中用于自然语言处理的工具包。对于NLTK的使用者而言,它就像是一名极其高效的语言学家,为您快速完成对自然语言文本的深层处理和分析。

Natural Language Toolkit官网
nltk Package API

 

 

nltk包的安装

pip install nltk

 

nltk包的使用方法


  
  1. from nltk.corpus import treebank
  2. t = treebank.parsed_sents('wsj_0001.mrg')[0]
  3. t.draw()

_images/tree.gif

 

nltk包的代码实现


  
  1. import nltk
  2. sentence = """At eight o'clock on Thursday morning
  3. tokens = nltk.word_tokenize(sentence)
  4. print(tokens)
  5. tagged = nltk.pos_tag(tokens)
  6. print(tagged )

 

相关文章
NLP之BoW&NLTK:自然语言处理中常用的技术——词袋法Bow、NLTK库

 

 

 

 

文章来源: yunyaniu.blog.csdn.net,作者:一个处女座的程序猿,版权归原作者所有,如需转载,请联系作者。

原文链接:yunyaniu.blog.csdn.net/article/details/87543561

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。