文本分类应用案例全面介绍

举报
语音语义创新Lab 发表于 2020/05/18 09:36:08 2020/05/18
【摘要】 基本概念: 为什么:文字是人类传递信息的最大的载体,文字存在于各个角落,如互联网、法律文书、聊天记录、社交媒体、案件记录、短息、邮件等等。如何从海量文本中挖掘出有价值的信息?如自动识别某些类别的信息等。 是什么:文本分类从给定的标签集合中自动地给文本打标签,其应用非常广泛,比如邮件自动回复等。

1      基本概念

为什么:文字是人类传递信息的最大的载体,文字存在于各个角落,如互联网、法律文书、聊天记录、社交媒体、案件记录、短息、邮件等等。如何从海量文本中挖掘出有价值的信息?如自动识别某些类别的信息等。

是什么:文本分类从给定的标签集合中自动地给文本打标签,其应用非常广泛,举例如下:

2      文本分类应用场景

1.         邮件自动回复:在跨境电商场景中,自动识别用户反馈的问题的类别,如产品质量问题、快递问题、产品描述问题等,并基于问题类别自动回复内容。

2.         邮件自动打标签:如自动识别邮件是不是垃圾邮件。

3.         12345咨询自动分拨:在政务场景中,自动识别用户反馈的问题类别,如环境污染、水污染、噪声问题、道路拥堵问题等,并基于问题类别自动分配到对应的处理部门进行处理。

4.         税种类别自动识别:根据经营范围,自动识别该经营范围需要交哪些税种,如增值税、个人所得税等。

5.         商品正负面评论识别:自动识别用户对商品的评论是正面评论还是负面评论。

6.         内容审核之广告检测:检测是不是广告。

7.         内容审核之灌水评论检测:检测评论是否是灌水评论。

8.         内容审核之涉政涉黄言论检测:自动判断一段文本是否涉政或涉黄。

9.         辱骂评论识别:自动判断一段文本是否涉及辱骂等。

10.     购买意愿识别:根据用户发表的微博等信息判断是否有购买某商品的意愿。

11.     税务问题分类:根据用户咨询的问题识别是哪一类问题,如APP问题、网站问题等。

12.     客服/聊天话题分类:自动识别客服跟用户聊天过程中用户反馈的问题类别,如是退货问题、物流问题、商品质量问题等。

13.     客服聊天情感分析:根据用户和客服聊天的内容进行情感分析,判断用户和客户的情感态度,其结果可以作为客服服务之间评估的维度之一。

14.     案件描述分类:根据民警的案件录入信息,自动判断案件是什么类型的案件,如短信诈骗、网络诈骗、熟人诈骗等。

15.     自杀倾向预测:根据用户的社交媒体发布的信息,自动识别用户是否有抑郁或自杀倾向等。

16.     欺诈短信识别:自动判断发过来的短信是否是诈骗短信。

17.     新闻分类:自动判断新闻类别,如政治类、经济类、民生类、体育类等。

18.     事件类型分类:自动判断事件的类型,如金融领域的新闻报道中涉及到的事件类别自动识别:聘任、辞职、增持、减持、会议召开。

19. 。。。。。。

欢迎大家基于以上例子为参考,给我们提出新的需求,方式如下:

1)        在下方直接留言讨论,并留下联系方式

2)        直接通过邮箱联系戚经理:qijianghui@huawei.com

 

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。