Home > 洞见

洞见

八分钟掌握设备故障模式及影响分析（MFMEA）

字数统计：3380字预计阅读时间：约8分钟

微信截图_20221130212020.jpg

装配线的效率取决于设备的设计和制造的可靠性。假设有一条包含 10 台设备的装配线。每台设备都可以以 90% 的正常运行时间运行，那么10 台设备组成的生产线的可靠性为 35%。

设备故障模式和影响分析 (MFMEA) 将有助于在设备或工装设计过程中识别关键设备和工装的、可靠性弱点。提高设备部件的可靠性具有更高可靠性。当可靠性无法进一步提高时，考虑以快速方式更换磨损部件的能力。

01 One

什么是设备故障模式和影响分析 (MFMEA)

设备 FMEA 是一种用于识别设备故障相关的风险的系统方法。MFMEA 的目的是提高设备的可靠性，减少维修时间并增加预防技术。MFMEA 是全面预测性维护 (TPM) 的组成部分。

设备 FMEA 最初确定了设备功能、操作速度和预期生产率或产能。也可以为设备或工装说明可靠性性能。列出了故障模式及其效果。如果有设计输入或特殊特性，也包括对最终用户的影响。严重性等级是针对每种影响确定的。

接下来，确定详细的原因及其机制，包括失效的物理原理。由于过去的失败或缺乏证据，很大的可能性将推动采取行动，以防止或减少因故障模式的影响。检测排名决定了设备和诊断控制的有效性。较差的检测排名将推动采取行动，以提高检测失败原因并警告即将发生故障的能力。MFMEA 还将通过降低风险优先级数 (RPN) 来跟踪改进。

02 Two

为什么要执行设备故障模式和影响分析 (MFMEA)

尽早识别每台设备或工具的风险是可取的。主要目标是在设备或工装设计之前识别潜在风险。在设备的设计审查期间、建造阶段和制造设施的初始试运行期间，审查已识别风险的缓解措施。此审查发生在将设备运送到用户设施之前。设备和工装的最终批准通常发生在客户生产设施的首次生产试运行中。

新技术和流程的风险被识别出来，如果无人看管，可能会导致失败。设备 FMEA 适用于：

• 客户要求提供证据来支持设备的可靠性目标;

• 引入新技术或新工艺;

• 由于改善、精益或质量成本项目而对工具/设备进行修改的当前流程;

• 当前设备放置在新环境或不同位置。

03 Three

如何执行设备故障模式和影响分析 (MFMEA)

设备 FMEA 有五个主要部分。每个部分都有不同的目的和不同的重点。这些部分在项目时间表内的不同时间进行审查，而不是一次全部审查。MFMEA 按以下顺序完成：

第一步：确定设备故障及类型

设备/工装或过程名称/功能

此栏允许工程师描述正在分析的技术。该功能可以是由一件设备提供的制造操作。该功能以动词-名词形式表示，描述了设备或过程操作的作用。任何一台设备或设备都可能具有多种功能。

要求

此列描述了功能的要求/测量和/或预期的速度或产能。这些要求由图纸或特殊特性列表提供。一种称为特性矩阵的质量功能部署 (QFD) 形式可用于将特殊特性与过程操作联系起来。要求必须是可测量的，并且应该有相关的测试和检查方法。建议行动的第一个机会可能是与设计工程师一起调查和澄清需求。

故障模式

故障模式也称为反功能，是对未满足要求的陈述。故障模式有五种：

•完全失败；

•部分失败；

•间歇性故障；

•降级故障；

•意外失败。

失败的影响

失败的影响集中在对流程、后续操作和/或潜在客户的影响上。许多影响可能是可能的，但是所有影响都应该出现在相应失效模式旁边的同一个单元格中。

严重性

选择每个影响的严重程度。严重程度等级通常在 1 到 10 之间。典型的 MFMEA 严重程度指南如下：

•1：工艺参数可变性在规格范围内；可以在正常维护期间进行调整或其他过程控制；

•2：过程参数可变性不在规格范围内；生产过程中需要进行调整或其他过程控制；无停机时间/不生产有缺陷的零件；

•3：停机时间长达10分钟，但不生产有缺陷的零件；

•4：停机时间10到30分钟，但不生产有缺陷的零件；

•5：停机时间在30分钟到1小时之间或生产有缺陷的零件长达1小时；

•6：停机1~4小时或生产不良件1~2小时；

•7：停机4-8小时或生产不良件2-4小时；

•8：停机大于8小时或生产不良件大于4小时；

•9-10：监管和/或安全影响。

最高严重性是从许多潜在影响中选择的，并放置在 MFMEA 表格的严重性列中。可以识别可以改变任何故障模式的设计方向的操作，其中结果影响等级为 9 或 10。如果识别了推荐操作，则将其放置在 MFMEA 表格的推荐操作列中。

分类

分类根据潜在风险分类特征的类型。这些特殊特性通常需要额外的工作、设计/过程防错、过程变异减少 (Cpk) 或防错。此栏指定可以识别设备 FMEA 与过程 FMEA或控制计划协作的特征的位置。

第二步：确定潜在原因及措施

潜在原因 /失败机制

为每种故障模式定义了原因，并应根据它们对故障模式的影响来确定。原因是集思广益，应集中在以下方面：材料、设备、测量和环境。应避免使用诸如“坏”、“差”、“有缺陷”和“失败”之类的词，因为它们没有足够详细地定义原因，无法进行风险计算以减轻风险。

设备控制预防

设备和设备方法定义的预防策略使用易于获取的标准部件、访问受限时的坚固部件以及不允许出现故障的诊断。经过验证的预防控制措施将降低原因的发生或可能性。预防控制越强，设备或工装工程师就越有可能意识到潜在原因。非常需要使用经过验证的标准和过去经过验证的技术来重复使用（类似的压力应用）。

发生

出现排名是基于已知数据或缺乏已知数据的估计。发生率可能与已知/类似技术或新工艺、设备或工具技术相关，并且与平均故障间隔时间 (MTBF) 相关。典型的 MFMEA 发生率指南如下：

•1：MTBF大于10000小时；

•2：MTBF 从 6,001 到 10,000 小时；

•3：MTBF 从 3,001 到 6,000 小时；

•4：MTBF 从 2,001 到 3,000 小时；

•5：MTBF 从 1,001 到 2,000 小时；

•6：MTBF 从 401 到 1,000 小时；

•7：断续运行导致10,000个生产件中有1个故障或MTBF为101至400小时；

•8：间歇运行导致100个生产件中有1个故障或MTBF为11至100小时；

•9：间歇性操作导致100个生产件中有1个故障或MTBF为2至10小时；

•10：间歇运行导致10个生产件中有1个故障或MTBF小于1小时；

可以针对具有高发生率的故障模式的原因采取行动。必须特别注意严重程度为 9 或 10 的项目。具有高严重性和发生组合的故障模式必须采取适当的措施以确保已证明尽职调查。

第三步故障探测

设备控制检测

为验证设备可以识别何时或是否可能发生故障而进行的活动被放置在当前设备控制检测列中。检测控制的几个例子是：

•防错装置（不能做出不合格品）；

•防错装置（不能通过不合格品）；

•接近、存在或磨损传感器；

•设备参数不稳定报警；

•目视检查。

检测排名

根据所选检测控制的类型，对每种检测方法进行检测排名。每个原因/故障模式组合通常有不止一种检测控制。最佳做法是在一个单元格中列出所有控件，并对每个控件应用检测排名。检测排名最低的放在检测列中。典型的 MFMEA 检测指南如下：

•1：设计/设备控制几乎肯定会检测到潜在原因/机制和后续故障模式；

•2：设计/设备控制很有可能会检测到潜在原因/机制和后续故障模式；

•3：设计/设备控制很有可能会检测到潜在原因/机制和后续故障模式；

•4：设计/设备控制检测潜在原因/机制和后续故障模式的可能性较高；

•5：设计/设备控制检测潜在原因/机制和后续故障模式的机会中等；

•6：设计/设备控制检测潜在原因/机制和后续故障模式的机会很小；

•7：设计/设备控制检测潜在原因/机制和后续故障模式的可能性很小；

•8：设计/设备控制将远程检测潜在原因/机制和后续故障模式；

•9：设计/设备控制检测潜在原因/机制和后续故障模式的可能性很小；

•10：设计/设备控制不会和/或无法检测潜在原因/机制和后续故障模式或没有设计/设备控制。

可能需要采取行动来改进当前的检测控制。改进将解决设备评估策略中的弱点。这些操作位于推荐操作列中。

第四步确定风险等级

风险优先级数 (RPN)

风险优先级数 (RPN) 是先前选择的排名的产物：严重性、发生率和检测率。动作确定中不允许使用 RPN 阈值。由于两个原因，不应分配 RPN 阈值：

•相对风险并不总是由 RPN 值表示；

•MFMEA 团队试图低于指定 RPN 阈值的不良行为。

*这种行为不会解决或改善风险。

建议的操作

推荐行动列是设备 FMEA 表格中放置所有潜在行动/改进的位置。完成的行动是 MFMEA 的目的。操作针对先前分配的排名之一。目标如下：

•消除严重性等级为 9 或 10 的所有故障模式；

•潜在原因的发生率较低；

•测试/评估技术的检测排名较低。

责任和目标完成日期

此处记录了负责人的姓名和行动完成的日期。如果存在项目时间表并显示日期和里程碑之间的联系，则可以使用里程碑名称代替特定日期。

第五步降低风险

采取的行动和完成日期

设备 FMEA 将采取行动，将较高风险的项目降低到可接受的风险水平。应记录所采取的每项行动的行动结果。如果行动不成功，则应确定另一个行动。重要的是要注意可接受的风险是可取的，并且将高风险降低到较低风险是主要目标。

重新排序 RPN

采取措施后，应将新的（重新排序的）RPN 与原始 RPN 进行比较。降低 RPN 是本专栏的主要目标。如上所述，如果采取措施后风险仍然过高，则必须制定新的措施。每次都重复这一过程，直到获得可接受的风险水平。

PREVIOUS：智能制造关键技术应用-以日本企业为例 Next:成功举办远程会议的 13 个策略

洞见

八分钟掌握设备故障模式及影响分析（MFMEA）

RELATED NEWS

订阅