- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Python4

冰峰发表于 2025/04/27 10:50:01 2025/04/27

【摘要】 ### 2.3 Python数据挖掘建模常用框架和库Python 拥有丰富的第三方库，在数据挖掘领域应用广泛。常用框架包括 TensorFlow、Keras、PyTorch、PaddlePaddle 和 Caffe 等；常用库则有 scikit-learn、jieba、SciPy、OpenCV、Pillow、Gensim 和 SnowNLP等。

2.3Python数据挖掘建模常用框架和库
Python拥有丰富的第三方库，在许多方面都有着广泛的应用，且随着各种模块的逐步完善，它在科学领域的地位越来越重要，这其中就包括数据挖掘领域。Python数据挖掘建模中常用的框架包括TensorFlow、Keras、PyTorch、PaddlePaddle、Caffe等，常用的库包括scikit-learn、jieba、SciPy、OpenCV、Pillow、Gensim和SnowNLP等。
2.3.scikit-learn
scikit-learn(简称sklearn)项目最早数据科学家大卫库尔纳佩在2007年发起，需要NumPy和SciPy等库的支持，经研发后，scikit-learn成为一个开源的机器学习库。
scikit-learn是Python下强大的机器学习工具包，提供了完善的机器学习工具箱，包括数据预处理、分类、回归、聚类、预测、模型分析等，同时还是一种简单高雄啊的数据挖掘和数据分析工具，可在各种环境中重复使用。scikit-learn内部还实现了各种各样成熟的算法，容易安装和使用，样例也十分丰富。由于scikit-learn依赖NumPy、SciPy和Matplotlib，所以只需要提前安装好几个库，基本可以正常安装和使用。若使用scikit-learn创建机器学习模型，则须注意以下几点。

<1>所有模型提供的接口都为model.fit()，用于训练模型。需要注意的是，用于分类与回归算法的训练模型的语句为fix(X,y),用语言非分类与回归算法的训练模型的语句为fix(X)。

<2>分类与回归模型提供如下接口。
a.model.predict(X_new):预测新样本。
b.model.predict_proba(X_new):预测概率，仅对某些模型有用（如逻辑回归）。
c.model.score():得分越高，模型拟合效果越好。

<3>非分类与回归模型提供如下接口。
a.modeltransform():在fit函数的基础上，进行标准化、降维、归一化等数据处理操作。
b.model.fit_traansform():fit函数和transform函数的组合，既包含训练，又包含数据处理操作。
scikit-learn本身还提供了一些实例数据用于练习，常见的有安德森鸢尾花卉数据集、手写图像数据集等。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Python4

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Python4

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品