MLS_学习笔记_设备预测性场景使用过程

举报
杨阳好阳光 发表于 2019/03/07 18:04:16 2019/03/07
【摘要】 设备预测性场景数据处理流程

一、预测性场景

    在工业、制造业领域设备的预测性维护是非常重要的,目前主要是定期维护保养,对于关键设备同时需要进行设备预测性维护。

二、数据要求

    需要积累一定时间的设备正常运行数据和故障数据,对故障类型打标签,然后采用分类或者回归算法进行设备的故障建模。

三、数据处理的难点

    故障数据相对正常运行来说是非常少的,并且对于设备的监测往往是传感器按时间采集的震动、位移等等信息,信息量较少

四、数据处理

  1.数据转换,传感器采集的信息是时序信息,且在时间长度上存在着长短不一的情况,在做设备的预测性维护之前,需要将传感器采集的原始数据进行一系列的变换,进行特征的生成,将基于时间的时序信息转换为非时序信息。

  2.特征处理,常见的有数据组合,特征统计和特征移位

          数据组合:多个特征按照一定规则形成新的特征,比如加和、相乘等;

          特征统计:在某个特征上采用一些统计量或者特殊的计算规则生成新的特征;

          特征移位:在时间相关的一些场景,可以将特征进行移位操作。

  3.特征选择,面对多维特征,大概率存在着与目标工作无关的特征,是冗余的,所以需要一些方法进行特征选择。

         主成分分析:将n维特征经过principal compos analysisPCA搜索k个最能代表数据信息的维度,在搜索、计算的过程中维度本身发生了改变,产生的是原始维度的 映射,将映射后的特征进行重要性排序。

           特征子集:当存在n个原始特征时,即有2n个特征子集。在n个特征进行筛选时,可以使用统计显著性检验的方法、信息增益的方法、决策树的方法。

           相关性分析:用于检验2个特征之间的相关性,主要指标有Pearson相关系数、Spearman相关系数、卡方检验等。

  4.特征规约,将特征划分到类似的空间当中,消除彼此度量差异造成的影响。

                    离散化:将连续型特征映射到一个类别当中,比如收入的具体数值映射为“高、中、低”,离散化包括等宽分箱、等频分箱、聚类分箱、临近分箱

                    标准化:将所有的连续型特征都归约到同一个区间上。常用的区间是[-11][01],常见有最大最小标准化,Z-score标准化,和值比例标准化。

                    光滑:与特征清洗类似,采用回归等技术去除特征上的噪声数据。

                    聚集:不关注每一条样本的特征信息,关注样本集分片后的特征信息,等同于在特征上分片。

五、实例分析

有个设备故障监测时序文件,并时序持续,有两列<rawdata,output>,表示两种维度上的测量数据,该设备是处于故障”Abnormal1”状态。

原始数据:                                             结果数据:

1551952673(1).jpg                1551952858(1).jpg











【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。