《scikit-learn机器学习常用算法原理及编程实战》—2.4.4 时间序列

举报
华章计算机 发表于 2019/05/31 16:25:08 2019/05/31
【摘要】 本书摘自《scikit-learn机器学习常用算法原理及编程实战》一书中的第2章,第2.4.4节,编著是黄永昌 .

2.4.4  时间序列

  Pandas提供了强大的时间序列处理功能,我们可以创建以时间序列为索引的数据集。比如,以2000年1月1日作为起始日期,创建366条记录数据:

  

  [IN]:

  n_items = 366

  ts = pd.Series(np.random.randn(n_items), index=pd.date_range(

    '20000101', periods=n_items))

  print(ts.shape)

  ts.head(5)

  

  [OUT]:

  (366,)

  Out[35]:

  2000-01-01   -0.217326

  2000-01-02    1.848070

  2000-01-03    0.056948

  2000-01-04   -0.075779

  2000-01-05   -0.135918

  Freq: D, dtype: float64

  

  我们可以对这些数据按照月份聚合:

  

  [IN]: ts.resample("1m").sum()

  [OUT]:

  2000-01-31    -4.777812

  2000-02-29    -0.042346

  2000-03-31    -6.610695

  2000-04-30    11.046234

  2000-05-31    -0.826357

  2000-06-30   -10.103365

  2000-07-31    -6.783077

  2000-08-31     8.397547

  2000-09-30    -0.462282

  2000-10-31    -9.748931

  2000-11-30    -2.069168

  2000-12-31     3.206750

  Freq: M, dtype: float64


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。