R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程
【摘要】
1. 数据分析的开端,Tidyverse?
tidyverse 是一个清晰的 R 包集合,在数据操作、探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念。它是由 RStudio 背后的首席科学家 Hadley Wickham 创建的。tidyverse 中的 R 包旨在提高统计学家和数据科学家的工作效率。包引导...
1. 数据分析的开端,Tidyverse?
tidyverse 是一个清晰的 R 包集合,在数据操作、探索和可视化领域提供统一的数据科学解决方案,这些解决方案具有共同的设计理念。它是由 RStudio 背后的首席科学家 Hadley Wickham 创建的。tidyverse 中的 R 包旨在提高统计学家和数据科学家的工作效率。包引导他们完成工作流程,促进沟通并产生可重复的工作产品。tidyverse 本质上侧重于使工作流成为可能的工具的互联。在数据科学项目中采用 tidyverse有很多优势。它提供一致的功能、工作流覆盖范围、数据科学教育、数据科学工具开发的简化路径以及提高生产力的潜力。
它的主要目标之一是帮助任何需要分析数据的人高效地工作。如下图所示,tidyverse可以帮助你实现:
-
数据导入/导出
-
数据清洗处理
-
批量建模
-
数据/模型结果可视化
-
生成(可交互)的分析报告. (eg. pdf, word, ppt)
本文主要讨论前两个目标及数据的创建导入导出,以及数据清洗处理。
-
tidyverse核心:管道操作 %>%
进行数据分析前先导入必要的包和数据:
-
1library(tidyverse)
-
2library(rio)
-
3data("german", package = "rchallenge")
首先查看你的数据集:
文章来源: wenyusuran.blog.csdn.net,作者:文宇肃然,版权归原作者所有,如需转载,请联系作者。
原文链接:wenyusuran.blog.csdn.net/article/details/121905356
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)