《scikit-learn机器学习常用算法原理及编程实战》—2.4.4 时间序列
2.4.4 时间序列
Pandas提供了强大的时间序列处理功能,我们可以创建以时间序列为索引的数据集。比如,以2000年1月1日作为起始日期,创建366条记录数据:
[IN]:
n_items = 366
ts = pd.Series(np.random.randn(n_items), index=pd.date_range(
'20000101', periods=n_items))
print(ts.shape)
ts.head(5)
[OUT]:
(366,)
Out[35]:
2000-01-01 -0.217326
2000-01-02 1.848070
2000-01-03 0.056948
2000-01-04 -0.075779
2000-01-05 -0.135918
Freq: D, dtype: float64
我们可以对这些数据按照月份聚合:
[IN]: ts.resample("1m").sum()
[OUT]:
2000-01-31 -4.777812
2000-02-29 -0.042346
2000-03-31 -6.610695
2000-04-30 11.046234
2000-05-31 -0.826357
2000-06-30 -10.103365
2000-07-31 -6.783077
2000-08-31 8.397547
2000-09-30 -0.462282
2000-10-31 -9.748931
2000-11-30 -2.069168
2000-12-31 3.206750
Freq: M, dtype: float64
- 点赞
- 收藏
- 关注作者
评论(0)