《R数据科学实战:工具详解与案例分析 》 —2.2.2 创建tbl格式

举报
华章计算机 发表于 2019/11/09 18:35:25 2019/11/09
【摘要】 本节书摘来自华章计算机《R数据科学实战:工具详解与案例分析》 一书中第二章,第2.2.2节,作者刘 健 邬书豪 。

2.2.2 创建tbl格式

在练习使用tibble时,可以通过函数tibble或tribble来创建新的数据框。tibble函数创建新数据框的方法与baseR中data.frame函数的方法一致。等号左边为变量名称,右边为相应的数据值,不同变量之间以逗号相隔。下面的代码创建了一个包含变量a和b的数据框,变量a包含6个值,分别为数字1到6,变量b为a列中的值乘以2,因此同为6个数值。<int>代表integer(整数),<dbl>代表double(浮点型)数据类型。创建数据框的代码如下:

> library(tibble)

> tibble(a = 1:6,b = a*2)

# A tibble: 6 x 2

      a     b

   <int> <dbl>

1     1    2.

2     2    4.

3     3    6.

4     4    8.

5     5   10.

6     6   12.

tribble函数比较适合用来创建小型数据集,可以采用常规excel表中数据分布的格式,直接手动输入数据,变量名称以“~”起始,逗号结束,数据值以逗号分隔。下面的代码即用来生成表2-2的。该函数在特定情况下会显得非常实用,比如,用来解释变量(或指标)和因子水平的元数据一般都会杂乱无章,使用软件清理既费时又费力,但当通过肉眼能够很容易提取到关键信息时,直接使用tribble函数手动生成变量和因子水平对照表会更高效。

     > tribble(

    ~id, ~gender, ~weight, ~age,

    1,   "男",    70,     23,

    2,   "女",    60,     25,

    3,   "女",    55,     26,

    4,   "女",    58,     22,

    5,   "男",    80,     23,

    6,   "男",    85,     30

)


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。