《R数据科学实战:工具详解与案例分析 》 —2.2.2 创建tbl格式
2.2.2 创建tbl格式
在练习使用tibble时,可以通过函数tibble或tribble来创建新的数据框。tibble函数创建新数据框的方法与baseR中data.frame函数的方法一致。等号左边为变量名称,右边为相应的数据值,不同变量之间以逗号相隔。下面的代码创建了一个包含变量a和b的数据框,变量a包含6个值,分别为数字1到6,变量b为a列中的值乘以2,因此同为6个数值。<int>代表integer(整数),<dbl>代表double(浮点型)数据类型。创建数据框的代码如下:
> library(tibble)
> tibble(a = 1:6,b = a*2)
# A tibble: 6 x 2
a b
<int> <dbl>
1 1 2.
2 2 4.
3 3 6.
4 4 8.
5 5 10.
6 6 12.
tribble函数比较适合用来创建小型数据集,可以采用常规excel表中数据分布的格式,直接手动输入数据,变量名称以“~”起始,逗号结束,数据值以逗号分隔。下面的代码即用来生成表2-2的。该函数在特定情况下会显得非常实用,比如,用来解释变量(或指标)和因子水平的元数据一般都会杂乱无章,使用软件清理既费时又费力,但当通过肉眼能够很容易提取到关键信息时,直接使用tribble函数手动生成变量和因子水平对照表会更高效。
> tribble(
~id, ~gender, ~weight, ~age,
1, "男", 70, 23,
2, "女", 60, 25,
3, "女", 55, 26,
4, "女", 58, 22,
5, "男", 80, 23,
6, "男", 85, 30
)
- 点赞
- 收藏
- 关注作者
评论(0)