【7天入门机器学习课程附加题:故障多分类】总结之三——机器学习应用之随机决策森林分类
这里使用华为云机器学习做具体实验学习。首先要有华为云帐号。然后登录并进入华为云机器学习服务。创建实例(具体操作见《7天入门机器学习》),并访问实例。
在主页可以添加案例进行实操学习。这里把《【7天入门机器学习课程附加题:故障多分类】总结之二——数据处理》处理好的数据xlj.csv、yzj.csv、csj.csv上传到数据栏中。模型栏中可以看到后面生成的模型。这里点开项目栏,创建空白项目以便后面操作。
1、图中上面的“从数据集读取数据”节点的数据文件是xlj.csv是训练集,文件有表头,无元数据,可以保存元数据,方便将来使用。
2、图中下面的“从数据集读取数据”节点的数据文件是yzj.csv是验证集,文件有表头,无元数据。
3、因为没有元数据,所以需要“修改元数据”节点修正数据类型并确定输入数据列和训练目标列。
4、“随机决策森林分类”为具体使用算法,里面有“树的数目,最大树深度、最大分箱数、不纯度、特征子集选取策略、随机种子”等参数供调整。
5、“保存模型”节点保存模型以供测试集使用
6、“模型应用”应用训练出来的模型对验证数据进行预测。
7、“分类模型评估”可以查看模型的评估结果。
8、也可以通过“保存数据到数据集”节点查看保存的数据分析预测结果。
二、创建预测流如图:
上图说明:
1、“读取模型”节点使用训练流保存的模型
3、“模型应用”应用所选的模型对测试数数据进行预测。
4、“保存数据到数据集”节点把预测结果保存到文件中。
三、对行预测结果投票得到文件预测结果
前面的预测结果为行预测结果。需要对行预测结果进行按文件名、预测结果标识分组统计,行预测结果标识统计数最多的标识作为文件的标识。
也许是数据质量好,默认参数都能得到较好的结果。
- 点赞
- 收藏
- 关注作者
评论(0)