故障诊断、RCA、RCFA和FMEA的定义和关系

2022/12/23 13:31:56 人评论 次浏览 分类:调试维修  文章地址:http://yunrun.com.cn/tech/4637.html

RCA、RCFA和FMEA在设备运维和故障诊断工作中是高频词汇,已经成了很多工程师的口头语,但是这几个名词都分别是什么意思?它们是故障诊断么?

仔细辨别这些词的意思并非咬文嚼字,在设备故障诊断以及设备全生命周期管理的工作中,这些名词具有专门的含义,并且也指向专门的工作。混淆和滥用会带来很多误解。


故障诊断的定义

故障诊断是最常用的词汇,因此与之相关的概念十分多,包括“故障”、“失效”等,同时故障诊断与相临近的工作发生很多联系,有时候故障诊断的内容也会和其他工作内容相互混淆,比如“维修”、“维护”、“预测性维护”、“状态监测”等。为了清楚故障诊断的含义,我们首先从故障诊断的定义谈起,然后介绍故障诊断的任务工作内容。

首先,故障诊断的定义:故障诊断也称诊断,是对设备或者系统故障进行查找的过程。用来检查寻找故障的程序称为诊断程序(请注意,这里的程序指的不一定是计算机程序,也包括流程,思路等),对其他设备或系统执行诊断的系统称为诊断系统。


故障诊断是一种了解机器在运行过程中的状态,并判断其正常或者异常的过程。
也有的资料里提出了,故障诊断是在机器运行过程中,不拆解机器并进行设备状态是否正常的判断。

故障诊断的范围(工作内容)

故障诊断的主要工作包含三个方面:故障监测与发现、故障位置确定、故障类型判断。

为了便于理解,经常将故障诊断工作的三个任务成为定时、定位、定责。


故障诊断的“定时”任务:当设备运行的时候,如果出现了某种故障,那么故障诊断的任务首先需要确定故障是什么时候发生的,这样的工作就是故障的定时。


故障诊断的“定位”任务:当设备出现故障的时候,故障诊断工作的一个重要任务就是确定故障发生的位置。故障定位的作用是为了后续故障处置工作提供信息支持。在一些设备的故障处置工作中,第一步往往是故障的隔离,也就是将发生故障的部位与整个系统进行隔离(在工业设备中,往往会使用设备切换的方式,将备用机投入使用),避免故障的扩展,此时故障诊断的定位就为故障隔离提供了目标。


故障诊断的“定责”任务:故障诊断的定责工作就是确定故障的类型。需要注意的是,严格意义的故障诊断定责工作就是故障类型的确定,不包含故障原因的查找以及故障的恢复工作。实际工作中,多数工程师都将故障诊断的定责与故障原因查找和故障恢复发生了混淆。


既然故障诊断的任务不包括故障原因的查找,那么平常的故障诊断工作中寻找问题原因的工作是如何进行的呢?在实际工作中,从设备出现故障,到工程师发现故障并非是一个完整的工作循环,其间还少了故障原因查找(分析)、故障处置与排除,设备故障恢复的工作,并且这这些工作过程中还需要采取一些措施,以防止故障再次出现。


所有这些从故障发现和类型确定环节到设备故障恢复环节中的工作,都需要基于针对故障的分析。


故障分析的工作分析什么呢?根据目的的不同又有哪些差异呢?今天昌晖仪表谈谈RCA、RCFA和FMEA。


RCA

RCA是Root Cause Analysis的缩写,字面上的意思是根本原因分析。事实上根据ASQ(American Society for Quality)的定义:RCA是一个结构性的调查过程,旨在确定导致问题的真正原因,并且采取相应措施消除这一诱因。

RCA是一个广泛的定义,它包含对问题诱因的解释和建模的一套宽范围的方法、工具和技术。事实上RCA不仅仅可以用于工业设备,它同样适用于组织机构问题、生产问题和管理问题等的分析。


同时,从RCA的定义不难发现,RCA包含了原因查找和采取相应措施等工作。
因此不难发现,设备工程师日常所进行的所谓故障诊断工作实际上更像RCA的工作。

RCFA

RCFA是Root Cause Failure Analysis 的缩写,字面意思是失效根本原因分析。RCFA是失效分析的范畴,失效分析的工作指的是对失效的观察、界定以及描述。在进行失效分析的过程中,不一定需要对导致失效的原因进行确认。

很多用户都会发现,当你把失效的设备给专门机构进行失效分析的时候,失效分析报告的结论仅仅是对失效模式进行分类,最多会加入一些国际标准对此类失效可能诱因的描述,并不会对你实际的设备问题和诱因进行分析。严格意义上说,这样的工作是符合RCFA定义的。


另一方面,RCFA的分析对象是“失效”。“失效”是以某种物理改变(或者物理失效)为目标的,而RCA分析的对象可能是安全事件、质量事件等更多领域的“故障”。


FMEA

FMEA是Failure Mode and Effects Analysis 的缩写,即失效模式及其后果分析。FMEA是在产品合计阶段和过程设计阶段对构成产品的子系统、零件,对构成过程的各个工序逐一进行分析,找出潜在失效模式、并分析其可能得后果,从而预先采取必要措施,提高产品质量和可靠性的系统化活动。

从FMEA的定义可以看到,这是一个基于假设的分析方法。这里的假设是指对“可能发生故障”的假设,也就是对于故障潜在发生的可能,其分析的指标包括风险和可能性等。


FMEA可以被理解为一种预先实施的分析工作,其目的是在问题发生以前减少问题诱因。这和大多数工程师所讨论的设备出现故障之后的分析和处置显然不是一回事儿。


故障诊断、RCA、RCFA和FMEA的关系

设备运维领域相关的名词具有本质的差异,并且具有一定的关系。

在设备进行设计、安装、调试和运行的时候,工程师会使用FMEA的体系去降低设备出现故障的可能性。


当设备投入运行的时候,故障诊断工作负责对故障发生的时间、位置和类型进行确认。


当设备故障的定时、定位、定责信息收集到之后,可以支持RCFA工作。通过RCFA工作进一步识别了设备失效的类型。所有的信息将通过RCA工作得到导致设备出现故障的原因,并提出改善措施避免故障再一次的发生。


上述过程才是设备从设计、安装、投入运行到最后故障恢复的全过程的正确叫法。因此,工程师们,请严格规范使用名词。

作者:王勇

共有访客发表了评论 网友评论

  客户姓名:
邮箱或QQ:
验证码: 看不清楚?