MLS_学习笔记_设备预测性场景使用过程
一、预测性场景
在工业、制造业领域设备的预测性维护是非常重要的,目前主要是定期维护保养,对于关键设备同时需要进行设备预测性维护。
二、数据要求
需要积累一定时间的设备正常运行数据和故障数据,对故障类型打标签,然后采用分类或者回归算法进行设备的故障建模。
三、数据处理的难点
故障数据相对正常运行来说是非常少的,并且对于设备的监测往往是传感器按时间采集的震动、位移等等信息,信息量较少。
四、数据处理
1.数据转换,传感器采集的信息是时序信息,且在时间长度上存在着长短不一的情况,在做设备的预测性维护之前,需要将传感器采集的原始数据进行一系列的变换,进行特征的生成,将基于时间的时序信息转换为非时序信息。
2.特征处理,常见的有数据组合,特征统计和特征移位
数据组合:多个特征按照一定规则形成新的特征,比如加和、相乘等;
特征统计:在某个特征上采用一些统计量或者特殊的计算规则生成新的特征;
特征移位:在时间相关的一些场景,可以将特征进行移位操作。
3.特征选择,面对多维特征,大概率存在着与目标工作无关的特征,是冗余的,所以需要一些方法进行特征选择。
主成分分析:将n维特征经过principal compos analysis或PCA搜索k个最能代表数据信息的维度,在搜索、计算的过程中维度本身发生了改变,产生的是原始维度的 映射,将映射后的特征进行重要性排序。
特征子集:当存在n个原始特征时,即有2n个特征子集。在n个特征进行筛选时,可以使用统计显著性检验的方法、信息增益的方法、决策树的方法。
相关性分析:用于检验2个特征之间的相关性,主要指标有Pearson相关系数、Spearman相关系数、卡方检验等。
4.特征规约,将特征划分到类似的空间当中,消除彼此度量差异造成的影响。
离散化:将连续型特征映射到一个类别当中,比如收入的具体数值映射为“高、中、低”,离散化包括等宽分箱、等频分箱、聚类分箱、临近分箱
标准化:将所有的连续型特征都归约到同一个区间上。常用的区间是[-1,1]和[0,1],常见有最大最小标准化,Z-score标准化,和值比例标准化。
光滑:与特征清洗类似,采用回归等技术去除特征上的噪声数据。
聚集:不关注每一条样本的特征信息,关注样本集分片后的特征信息,等同于在特征上分片。
五、实例分析
有个设备故障监测时序文件,并时序持续,有两列<rawdata,output>,表示两种维度上的测量数据,该设备是处于故障”Abnormal1”状态。
原始数据: 结果数据:
- 点赞
- 收藏
- 关注作者
评论(0)