从“分类”到“解释”:热力学仿真辅助随机森林如何进行可解释故障诊断
参考论文📜:
Thermodynamic Simulation-assisted Random Forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines, Measurement, 2025.
为什么传统方案常常卡在工程现场?
船用柴油机燃烧室故障诊断看似是“分类问题”,但真正落地时,困难并不在算法本身,而在数据与可信性:
- 故障样本天然稀缺:真实故障发生频率低、采集代价高;
- 纯机理模型难以在线部署:高保真仿真可解释,但实时性不足;
- 黑箱模型难以服众:预测结果可用,但维护人员仍会追问“依据是什么”。
这篇研究给出了一条实用路线:先用热力学仿真补足样本,再用随机森林完成判别,最后用 SHAP 把模型决策“翻译”成可读的机理证据。
TSRF的核心价值:把机理与数据放进同一条链路
TSRF(Thermodynamic Simulation-assisted Random Forest)并不是简单叠加两个工具,而是构建了一个闭环流程:
- 仿真扩展数据边界:生成正常与多故障状态下的热力学特征;
- 随机森林完成多类识别:在非线性关系中稳定学习“参数—故障”映射;
- SHAP追溯决策依据:定量给出每个参数对分类结果的贡献方向与强度。

TSRF:机理建模、模型训练与解释分析的一体化流程图
一维热力学模型与实测校准
研究首先搭建柴油机燃烧室一维热力学模型,描述缸内关键状态量的动态变化。之后通过实测数据进行参数标定,使仿真输出与实际工况在核心指标上保持一致。
柴油机一维热力学模型示意图
为了让模型持续贴近现场工况,作者还结合 DCM(Data Collection Module)数据进行滚动修正,增强仿真数据的可验证性。

数据采集模块(DCM)
五类典型故障可控复现
在校准完成后,研究围绕燃烧室关键参数进行定向扰动,构建了 5 类具有明确物理含义的故障场景:
| 编号 | 故障类型 | 机理侧重点 | 主要参数设置 |
| F1 | 缸盖裂纹 | 热-机械耦合损伤与散热退化 | 缸盖表面温度 TH 提升至 346 °C |
| F2 | 活塞烧蚀活塞烧蚀 | 材料退化引起热烧蚀并伴随窜气 | 活塞温度 TP 升高 + 窜气 0.01 kg/s |
| F3 | 缸套磨损 | 几何变形导致密封显著失效 | 缸径增大 + 窜气 0.03 kg/s |
| F4 | 活塞环磨损 | 密封性能下降并触发窜气恶化 | 窜气质量流量 0.02 kg/s |
| F5 | 活塞环粘着 | 积碳与润滑恶化导致热边界变化 | 缸径变化 + 缸套温升 + 窜气 |
这一步的意义是:在真实故障样本不足的条件下,依然能得到机理一致、类别清晰、可用于训练的样本空间。
RF + SHAP给出诊断证据
模型侧采用两级筛选策略,目标是从“能分对”走向“讲得清”:
阶段一:随机森林粗筛
- 学习故障类别与热力学变量的非线性关系;
- 初步评估特征重要性并排除弱相关变量。
阶段二:Tree SHAP细化解释
- 计算每个样本、每个特征的 SHAP 贡献值;
- 提取高贡献且具物理意义的关键参数组合。

RF 与 Tree SHAP 联合特征筛选流程图
结果说明
实验表明,TSRF 在小样本条件下依然实现了 95% 以上诊断准确率。更重要的是,解释结果能够区分不同故障对应的主导热力学因素,为维护决策提供可追溯依据,而不仅仅是一个“类别标签”。
换句话说,这项工作提供的不只是更高精度,而是一种更容易被工程团队接受的诊断范式:机理可对照、结果可解释、模型可部署。
- 点赞
- 收藏
- 关注作者
评论(0)