R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程

举报
格图洛书 发表于 2021/12/28 22:17:06 2021/12/28
【摘要】 1. 数据分析的开端,Tidyverse? tidyverse 是一个清晰的 R 包集合,在数据操作、探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念。它是由 RStudio 背后的首席科学家 Hadley Wickham 创建的。tidyverse 中的 R 包旨在提高统计学家和数据科学家的工作效率。包引导...

1. 数据分析的开端,Tidyverse?

tidyverse 是一个清晰的 R 包集合,在数据操作、探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念。它是由 RStudio 背后的首席科学家 Hadley Wickham 创建的。tidyverse 中的 R 包旨在提高统计学家和数据科学家的工作效率。包引导他们完成工作流程,促进沟通并产生可重复的工作产品。tidyverse 本质上侧重于使工作流成为可能的工具的互联。在数据科学项目中采用 tidyverse有很多优势。它提供一致的功能、工作流覆盖范围、数据科学教育、数据科学工具开发的简化路径以及提高生产力的潜力。

它的主要目标之一是帮助任何需要分析数据的人高效地工作。如下图所示,tidyverse可以帮助你实现:

  1. 数据导入/导出

  2. 数据清洗处理

  3. 批量建模

  4. 数据/模型结果可视化

  5. 生成(可交互)的分析报告. (eg. pdf, word, ppt)

本文主要讨论前两个目标及数据的创建导入导出,以及数据清洗处理。

图片

  • tidyverse核心:管道操作 %>%

进行数据分析前先导入必要的包和数据:


  
  1. 1library(tidyverse)
  2. 2library(rio)
  3. 3data("german"package = "rchallenge"

首先查看你的数据集:

文章来源: wenyusuran.blog.csdn.net,作者:文宇肃然,版权归原作者所有,如需转载,请联系作者。

原文链接:wenyusuran.blog.csdn.net/article/details/121905356

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。