机器学习案例(十):新闻分类

举报
川川菜鸟 发表于 2022/09/25 00:38:38 2022/09/25
【摘要】 当访问新闻网站时,你一定已经看到了分类的新闻。你会在几乎所有新闻网站上看到的一些热门类别是科技、娱乐和体育。如果想知道如何使用机器学习对新闻类别进行分类,本文将会介绍它。 每个新闻网站在发布之前都会对新...

当访问新闻网站时,你一定已经看到了分类的新闻。你会在几乎所有新闻网站上看到的一些热门类别是科技、娱乐和体育。如果想知道如何使用机器学习对新闻类别进行分类,本文将会介绍它。

每个新闻网站在发布之前都会对新闻文章进行分类,以便每次访问者访问他们的网站时都可以轻松点击他们感兴趣的新闻类型。例如,我喜欢阅读最新的技术更新,所以每次访问新闻网站时,我都会点击技术部分。但是你可能喜欢也可能不喜欢阅读技术,你可能对政治、商业、娱乐或体育感兴趣。

目前,新闻文章是由新闻网站的内容管理者手工分类的。但为了节省时间,他们还可以在自己的网站上使用机器学习模型,读取新闻标题或新闻内容,并对新闻类别进行分类。在下面的部分中,我将带你了解如何使用 Python 编程语言为新闻分类任务训练机器学习模型。

一、数据集

对于使用机器学习进行新闻分类的任务,我从 Kaggle 收集了一个数据集,其中包含新闻文章,包括它们的标题和类别。该数据集中涵盖的类别是:

  1. Sports
  2. Business
  3. Politics
  4. Tech
  5. Entertainment</

文章来源: chuanchuan.blog.csdn.net,作者:川川菜鸟,版权归原作者所有,如需转载,请联系作者。

原文链接:chuanchuan.blog.csdn.net/article/details/126753420

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。