高效的大型时间序列数据压缩方法 MidiMax 压缩算法 | 让时间序列可视化更容易

举报
叶庭云 发表于 2022/07/07 22:20:37 2022/07/07
【摘要】 文章目录 一、引言 二、Midimax 压缩算法 三、Python 实践 一、引言 CSDN 叶庭云:https://yetingyun.blog.csdn...


一、引言

CSDN 叶庭云https://yetingyun.blog.csdn.net/

在实际时间序列场景中,例如金融时序数据,经常需要先对其进行可视化以方便我们了解数据,但金融时间序列数据量一般来说是非常巨大的,所以直接可视化的话需要花费较多的 RAM,磁盘等计算存储资源,本文介绍一种时间序列压缩算法 “Midimax”,该算法能够压缩时间序列数据并尽可能最大化保留原始时间序列数据信息(学通信的同学可能更清楚信号压缩的关键原理和注意事项~~)。该算法的设计有如下几点目标:

  • 不引入非实际数据,只返回原始数据的子集。所以没有平均、插值、回归和统计聚合等;
  • 计算高效,有较低的时间复杂度和空间复杂度;
  • 最大化信息增益。这意味着它尽可能多地捕捉原始数据中的变化;
  • 由于取最小和最大点可能会给出夸大方差的错误观点&#x

文章来源: yetingyun.blog.csdn.net,作者:叶庭云,版权归原作者所有,如需转载,请联系作者。

原文链接:yetingyun.blog.csdn.net/article/details/125648336

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。