Python4

举报
冰峰 发表于 2025/04/27 10:50:01 2025/04/27
【摘要】 ### 2.3 Python数据挖掘建模常用框架和库Python 拥有丰富的第三方库,在数据挖掘领域应用广泛。常用框架包括 TensorFlow、Keras、PyTorch、PaddlePaddle 和 Caffe 等;常用库则有 scikit-learn、jieba、SciPy、OpenCV、Pillow、Gensim 和 SnowNLP等。

2.3Python数据挖掘建模常用框架和库
Python拥有丰富的第三方库,在许多方面都有着广泛的应用,且随着各种模块的逐步完善,它在科学领域的地位越来越重要,这其中就包括数据挖掘领域。Python数据挖掘建模中常用的框架包括TensorFlow、Keras、PyTorch、PaddlePaddle、Caffe等,常用的库包括scikit-learn、jieba、SciPy、OpenCV、Pillow、Gensim和SnowNLP等。
2.3.scikit-learn
scikit-learn(简称sklearn)项目最早数据科学家大卫 库尔纳佩在2007年发起,需要NumPy和SciPy等库的支持,经研发后,scikit-learn成为一个开源的机器学习库。
scikit-learn是Python下强大的机器学习工具包,提供了完善的机器学习工具箱,包括数据预处理、分类、回归、聚类、预测、模型分析等,同时还是一种简单高雄啊的数据挖掘和数据分析工具,可在各种环境中重复使用。scikit-learn内部还实现了各种各样成熟的算法,容易安装和使用,样例也十分丰富。由于scikit-learn依赖NumPy、SciPy和Matplotlib,所以只需要提前安装好几个库,基本可以正常安装和使用。若使用scikit-learn创建机器学习模型,则须注意以下几点。

<1>所有模型提供的接口都为model.fit(),用于训练模型。需要注意的是,用于分类与回归算法的训练模型的语句为fix(X,y),用语言非分类与回归算法的训练模型的语句为fix(X)。

<2>分类与回归模型提供如下接口。
a.model.predict(X_new):预测新样本。
b.model.predict_proba(X_new):预测概率,仅对某些模型有用(如逻辑回归)。
c.model.score():得分越高,模型拟合效果越好。

<3>非分类与回归模型提供如下接口。
a.modeltransform():在fit函数的基础上,进行标准化、降维、归一化等数据处理操作。
b.model.fit_traansform():fit函数和transform函数的组合,既包含训练,又包含数据处理操作。
scikit-learn本身还提供了一些实例数据用于练习,常见的有安德森鸢尾花卉数据集、手写图像数据集等。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。