- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

MLS_学习笔记_设备预测性场景使用过程

杨阳好阳光发表于 2019/03/07 18:04:16 2019/03/07

【摘要】设备预测性场景数据处理流程

一、预测性场景

在工业、制造业领域设备的预测性维护是非常重要的，目前主要是定期维护保养，对于关键设备同时需要进行设备预测性维护。

二、数据要求

需要积累一定时间的设备正常运行数据和故障数据，对故障类型打标签，然后采用分类或者回归算法进行设备的故障建模。

三、数据处理的难点

故障数据相对正常运行来说是非常少的，并且对于设备的监测往往是传感器按时间采集的震动、位移等等信息，信息量较少。

四、数据处理

1.数据转换，传感器采集的信息是时序信息，且在时间长度上存在着长短不一的情况，在做设备的预测性维护之前，需要将传感器采集的原始数据进行一系列的变换，进行特征的生成，将基于时间的时序信息转换为非时序信息。

2.特征处理，常见的有数据组合，特征统计和特征移位

数据组合：多个特征按照一定规则形成新的特征，比如加和、相乘等；

特征统计：在某个特征上采用一些统计量或者特殊的计算规则生成新的特征；

特征移位：在时间相关的一些场景，可以将特征进行移位操作。

3.特征选择，面对多维特征，大概率存在着与目标工作无关的特征，是冗余的，所以需要一些方法进行特征选择。

主成分分析：将n维特征经过principal compos analysis或PCA搜索k个最能代表数据信息的维度，在搜索、计算的过程中维度本身发生了改变，产生的是原始维度的映射，将映射后的特征进行重要性排序。

特征子集：当存在n个原始特征时，即有2ⁿ个特征子集。在n个特征进行筛选时，可以使用统计显著性检验的方法、信息增益的方法、决策树的方法。

相关性分析：用于检验2个特征之间的相关性，主要指标有Pearson相关系数、Spearman相关系数、卡方检验等。

4.特征规约，将特征划分到类似的空间当中，消除彼此度量差异造成的影响。

离散化：将连续型特征映射到一个类别当中，比如收入的具体数值映射为“高、中、低”，离散化包括等宽分箱、等频分箱、聚类分箱、临近分箱

标准化：将所有的连续型特征都归约到同一个区间上。常用的区间是[-1，1]和[0，1]，常见有最大最小标准化，Z-score标准化，和值比例标准化。

光滑：与特征清洗类似，采用回归等技术去除特征上的噪声数据。

聚集：不关注每一条样本的特征信息，关注样本集分片后的特征信息，等同于在特征上分片。

五、实例分析

有个设备故障监测时序文件，并时序持续，有两列<rawdata,output>，表示两种维度上的测量数据，该设备是处于故障”Abnormal1”状态。

原始数据：结果数据：

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

MLS_学习笔记_设备预测性场景使用过程

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

MLS_学习笔记_设备预测性场景使用过程

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品