MLS使用记录---分类问题

举报
杨阳好阳光 发表于 2019/02/02 09:44:59 2019/02/02
【摘要】 通过对分类问题的分析,记录分析过程和设计和使用过程。

1、使用场景介绍

场景说明:某设备的运行会出现3种故障(Abnromal1、Abnormal2、Abnormal3)和正常状态(Normal)。

训练数据:提供了6个文件,每个文件包含2维度数据,每个文件表示一个时间序列,每一行表示某个时间点采集的2维数据。

测试数据:提供了56个文件,每个文件包含2维数据,每个文件表示一个时间序列。

2、数据理解

    初步理解:这属于一个分类问题,需要对已知的数据进行标签训练,进而对未标签的进行分类。其中1个文件为1个类标签,1个文件有3行54列,其中第1列属于时间序列,第2列是输入值,第3列是输出值。其中每个文件的第1列的时间都一样,可以不予以考虑,也就是说有2维特征。训练数据有6个文件,其中前4个文件分别为3类故障和正常状态,最后2个文件为正常状态的数据,可用于进行模型验证。

   深层理解:若通过上述进行分类效果不佳,可以对数据进行整理,提取其他特征。对数据进行初步显示分析,如下:

1549070773(1).jpg

从二维图可见,故障1和2/3以及正常状态很明显可以分开,但是在故障2和3之间存在重叠,根据这个问题可以进行特征提取,基本思路是可以增加统计类特征,如每隔几个数据进行统计均值、方差,中值,最大和最小等。这样形成一个新的数据。最终选取哪些特征需要进行整理验证。

重新标记如下:

1549071059(1).jpg

4、实验验证

数据整理完成后,则进行建模验证,建模如下:


1549071297(1).jpg

模型中上面的从数据集读取数据读取的是训练数据,下面的从数据集读取数据是验证数据,上面的分类方法可以进行更换。

1549071595(1).jpg

如果模型调整好后,可以将模型保存下来,进行使用流程,如下:

1549071395(1).jpg

看到运行成功可以查看保存的数据集文档,由于一个文件可能有不同的分类结果,对分类结果进行统计,从而给出最终结果。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。