Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略

举报
一个处女座的程序猿 发表于 2021/03/28 01:27:36 2021/03/28
【摘要】 Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略         目录 pandas-profiling库的简介 pandas-profiling库的安装 pandas-profiling库的使用方法 1、基础用法     &...

Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略

 

 

 

 

目录

pandas-profiling库的简介

pandas-profiling库的安装

pandas-profiling库的使用方法

1、基础用法


 

 

 

pandas-profiling库的简介

        从pandas数据路由生成配置文件报告。pandas df.describe()函数很棒,但对于严肃的探索性数据分析来说有点基础。pandas_profiling通过php .profile_report()扩展了pandas DataFrame,用于快速数据分析。对于每一列,以下统计数据-如果与列类型相关-在一个交互式HTML报告中显示:

  • 类型推断:检测数据流中的列类型。
  • 基本要素:类型、唯一值、缺失值
  • 分位数统计如最小值,Q1,中位数,Q3,最大值,范围,四分位数范围
  • 描述统计,如平均值,众数,标准差,总和,中位数绝对偏差,变异系数,峰度,偏度
  • 最常见的价值观
  • 柱状图
  • 高度相关变量的相关性突出,Spearman, Pearson和Kendall矩阵
  • 缺失值矩阵,计数,热图和缺失值的树状图
  • 学习文本数据的分类(大写,空格),脚本(拉丁语,西里尔字母)和块(ASCII)。
  • 文件和图像分析提取文件大小,创建日期和尺寸和扫描截短的图像或那些包含EXIF信息。

 

 

 

pandas-profiling库的安装

pip install pandas-profiling

 

 

 

pandas-profiling库的使用方法

1、基础用法


  
  1. import numpy as np
  2. import pandas as pd
  3. from pandas_profiling import ProfileReport
  4. df = pd.DataFrame(
  5. np.random.rand(100, 5),
  6. columns=["a", "b", "c", "d", "e"]
  7. )
  8. profile = ProfileReport(df, title="Pandas Profiling Report")
  9. profile.to_file("your_report.html")
  10. profile = ProfileReport(large_dataset, minimal=True)
  11. profile.to_file("output.html")
  12. profile = df.profile_report(title='Pandas Profiling Report', plot={'histogram': {'bins': 8}})
  13. profile.to_file("output.html")

 

 

 

 

 

文章来源: yunyaniu.blog.csdn.net,作者:一个处女座的程序猿,版权归原作者所有,如需转载,请联系作者。

原文链接:yunyaniu.blog.csdn.net/article/details/109710384

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。