Python:使用pyhanlp 进行分词

举报
彭世瑜 发表于 2021/08/13 23:21:42 2021/08/13
1.6k+ 0 0
【摘要】 pyhanlp调用java实现的HanLP接口进行分词 安装 pip install pyhanlp 1 pyhanlp: https://github.com/hankcs/pyhanlp HanLP: https://github.com/hankcs/HanLP 代码示例 # -*- coding: utf-8 -*- from pyhanlp imp...

pyhanlp调用java实现的HanLP接口进行分词

安装

pip install pyhanlp

  
 

pyhanlp: https://github.com/hankcs/pyhanlp
HanLP: https://github.com/hankcs/HanLP

代码示例

# -*- coding: utf-8 -*-

from pyhanlp import HanLP

document = "你好,欢迎在Python中调用HanLP的API"

# 分词
print(HanLP.segment(document))
"""
[你好/vl, ,/w, 欢迎/v, 在/p, Python/nx, 中/f, 调用/v, HanLP/nx, 的/ude1, API/nx]
"""

# 关键词提取
print(HanLP.extractKeyword(document, 2))
# [中, 调用]

# 自动摘要
print(HanLP.extractSummary(document, 3))
# [欢迎在Python中调用HanLP的API]

  
 

文章来源: pengshiyu.blog.csdn.net,作者:彭世瑜,版权归原作者所有,如需转载,请联系作者。

原文链接:pengshiyu.blog.csdn.net/article/details/95497382

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。