使用jieba 提取 关键词

举报
毛利 发表于 2021/07/15 06:58:54 2021/07/15
【摘要】 如何提取句子的关键词? 以前用textrank4zh https://blog.csdn.net/weixin_44510615/article/details/89548486 竟然不知道 jieba.analyse 也可以提取关键词,还封装了tfidf 的接口 from jieba import analyse tfidf = analyse.extract...

如何提取句子的关键词?

以前用textrank4zh

https://blog.csdn.net/weixin_44510615/article/details/89548486

竟然不知道 jieba.analyse 也可以提取关键词,还封装了tfidf 的接口

from jieba import analyse
tfidf = analyse.extract_tags

if __name__ == '__main__': text=""" 据半岛电视台援引叙利亚国家电视台称,叙利亚已经对美国、英国、法国的空袭进行了反击。据介绍,在叙军武器库中,对西方最具威慑力的当属各型战术地对地弹道导弹。 尽管美英法是利用巡航导弹等武器发动远程空袭,但叙军要对等还击却几乎是“不可能完成的任务”。目前叙军仍能作战的战机仍是老旧的苏制米格-29、米格-23、米格-21战斗机和苏-22、苏-24轰炸机,它们在现代化的西方空军面前难有自保之力,因此叙军的远程反击只能依靠另一个撒手锏——地对地战术弹道导弹。 """ # 关键词提取所使用停用词文本语料库可以切换成自定义语料库的路径。 analyse.set_stop_words("stopwords.txt") # 引入TextRank关键词抽取接口 textrank = analyse.textrank # 基于TextRank算法进行关键词抽取 keywords_textrank = textrank(text,topK = 10, withWeight = False, allowPOS = ('n','ns','vn','v','nz')) # 输出抽取出的关键词 for keyword in keywords_textrank: print (keyword + "/") print ("TFIDF") # TFIDF keywords_tfidf = analyse.extract_tags(text,topK = 10, withWeight = False, allowPOS = ('n','ns','vn','v','nz')) # 输出抽取出的关键词 for keyword in keywords_tfidf: print (keyword + "/")

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
叙军/
远程/
空袭/
电视台/
战术/
反击/
空军/
现代化/
叙利亚/
地对地/
TFIDF
****************************************************
叙军/
地对地/
空袭/
弹道导弹/
远程/
叙利亚/
电视台/
反击/
战术/
撒手锏/


  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23

看来要重新认识一些jieba

文章来源: maoli.blog.csdn.net,作者:刘润森!,版权归原作者所有,如需转载,请联系作者。

原文链接:maoli.blog.csdn.net/article/details/90759764

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。