欢迎光临: TPP CONSULTANCY & SERVICE
  Home  >  洞见

洞见

SPC里最危险的,不是“非正态”,而是你根本没看懂现场

字数统计:5246 字 预计阅读时间:约 11 分钟





很多企业在做SPC时,都遇到过一种情况:控制图“看起来不正常”,数据分布也不像标准钟形曲线,系统不断提示“非正态”。

于是现场第一反应往往是:是不是数据错了?是不是要赶紧做数学变换,把图“修正回来”?但真正的问题是:非正态,本身就是过程在向我们“说话”。

有些非正态,代表现场真的存在风险。例如:设备差异、模穴差异、批次混料、刀具磨损、自动补偿、过程漂移等,这些都会让数据出现双峰、偏态、长尾,而这些异常背后,往往对应的正是过程失控或潜在质量风险。

但也有另一类情况:过程本身就不适合硬套“正态分布”。例如漏率、电镀厚度、不良率、寿命类数据、缺陷数量等,本来就具有天然偏态或物理边界。如果仍然强行按正态逻辑分析,很容易得到“统计上漂亮、现场却无意义”的结果。

所以,真正成熟的SPC,不是急着把非正态“修正成正态”,而是先理解:这个非正态,到底是在暴露过程风险,还是在提醒我们——这个过程本来就不该这样分析。

本文想讨论的核心,并不是数学变换,而是:如何真正理解“非正态”背后的现场。

01 One

控制图≠ 过程能力

很多人一接触SPC,就会默认认为:只要Cp、Cpk很好,过程就一定很稳定;控制图没报警,产品就一定没问题。

但实际上,这是两件完全不同的事情。控制图更像“心电图”,它关注的是:过程现在有没有异常波动、有没有突然失控、运行是否稳定;

Cp/Cpk更像“考试成绩”,它衡量的是:这个过程做出来的产品,距离客户要求还有多少余量,能力够不够。

很多企业的问题就在这里:明明过程每天都在波动、漂移、补偿,甚至已经出现异常,但因为Cp/Cpk“还不错”,于是误以为过程没有问题。结果往往是:报表很好看,客户投诉却越来越多。

02 Two

什么时候会出现“非正态”?

很多人一看到控制图“不像钟形曲线”,第一反应就是:是不是数据错了?但实际上,制造现场里,大量过程本来就不一定符合“标准正态分布”。

1)工艺天然非正态:有些工艺,本身就容易出现偏态。

例如:电镀厚度、漏率、寿命、粗糙度、焊接飞溅等,这些过程会受到位置、电流、材料、时间等因素影响,数据天然就可能一边高、一边低,很难形成标准对称的分布。

2)过程被人为“修正”:这在现场非常常见。

例如:操作员发现数据快超上限了,就马上调机;快到下限了,又立刻补偿。长期下来,数据会像被“削平”一样,形成一种典型的“截尾分布”。表面上看波动变小了,但实际上,过程可能一直在被人为频繁干预。

3)混料 / 混机 / 混批:很多企业的数据,其实是“混”出来的。例如:两台机床、两个模穴、两个供应商的数据全部放在一起分析,就很容易形成“双峰分布”。因为不同来源的数据,本来就不是同一个过程,却被当成一个整体去统计。

4)测量分辨率不够:有时候问题不在过程,而在量具。例如:量具精度太粗,测出来的数据只能一格一格跳动,看起来像“台阶”一样,这种现象叫“阶梯化”。这并不代表过程真的稳定,而可能只是测量能力不够。

5)数据本来就不是连续型:还有一些数据,本来就不适合硬套正态分布。

例如:缺陷数、不良率、漏点数量等,它们属于“计数型数据”,而不是长度、厚度这种连续变化的数据。如果仍然强行按正态逻辑分析,很容易得到错误结论。

03Three

最重要:先判断“是否稳定”

这是SPC里一个非常典型的问题。很多企业一看到“非正态”,第一反应就是赶紧做数学处理,例如:Box-Cox变换、Johnson变换、数据拟合……想办法把图“修漂亮”。

但很多时候,真正的问题根本不在统计方法,而在现场本身。正确的顺序,不是先研究“怎么把数据变正态”,而是先确认:这个过程到底稳不稳定。例如现场是否存在:• 特殊原因波动• 数据漂移• 周期性变化• 换刀影响• 换班影响• 温度变化(温漂)• 设备补偿干预

因为如果过程本身就不稳定,那么讨论“是不是正态”,其实没有太大意义。

这就像一个人在跑步、发烧、情绪波动时去测心率,你很难判断他的“正常状态”到底是什么。

过程也是一样。如果现场本身一直在变化、干预、波动,那么再漂亮的统计模型,也无法真正反映过程真实状态。所以成熟企业做SPC时,第一件事往往不是“做变换”,而是先回到现场,理解过程到底发生了什么。

04Four

如何判断非正态?

判断非正态,不一定一上来就做复杂计算。很多时候,先把数据“画出来”,就能看出问题。

方法1:看直方图

直方图最直观。它就像把一堆数据排成“山形图”,看看这座“山”长什么样。

如果数据明显一边高一边低,可能是偏态;如果出现两个高峰,可能是双峰;如果一边拖得很长,可能是长尾。这些形状,往往都在提醒我们:数据背后可能有不同的过程来源或异常因素。

方法2:看正态概率图

正态概率图可以理解为:把数据拿去和“标准正态分布”做对比。

如果点大致沿着一条直线排列,说明数据比较接近正态;如果点明显弯曲、翘尾,或者中间断开,就说明它可能不是正态。

方法3:做正态检验

如果需要更严谨一点,可以使用正态检验,例如 Anderson-Darling、Shapiro-Wilk 等。但要注意,检验结果只是一个判断依据,不能替代现场分析。尤其当数据量很大时,哪怕一点轻微偏差,也可能被判定为“非正态”。

所以真正关键的不是软件提示了什么,而是这些数据形状背后,现场到底发生了什么。

05Five

最重要:先判断“是否稳定”真正核心:如何处理非正态?

真正重要的,不是“修正数据”,而是理解过程。

方法1:不要强行“正态化”(最重要)

这是很多企业最大的误区。一看到“非正态”,马上开始做各种数学变换,目的往往只有一个——把Cpk变漂亮。

于是过程变成了:“不是正态” → 强行变换 → 得到一个很好看的Cpk。但问题是:统计结果变漂亮了,不代表现场风险消失了。

如果设备本身在漂移、模穴之间存在差异、刀具已经磨损,那么即使通过数学方法把数据“修成正态”,真正的问题依然还在现场。

所以SPC里一个非常重要的原则是:不要为了得到漂亮的Cpk,而做脱离现场的“数学游戏”。真正成熟的SPC,是通过数据去理解过程,而不是通过统计去“美化过程”。

方法2:先分析“为什么会非正态”:这才是真正的核心。

例如出现“双峰分布”时,很多时候并不是统计问题,而是在提醒你:现场可能混了不同来源的数据。

比如两台设备、两个模穴、两种原料的数据被放在一起分析,它们本来就不是同一个过程。这时候真正应该做的,不是整体拟合,而是“过程分层”——把不同设备、模穴、批次分开做SPC。

再例如“长尾分布”,很多时候意味着:现场可能存在偶发异常、设备磨损、刀具失效等问题。不是统计误差,而是真实过程风险正在暴露。很多时候,非正态本身,就是过程给我们的信号。

方法3:使用适合的控制图

还有一个常见问题是:很多企业不管什么数据,都统一套用 Xbar-R 控制图。但实际上,并不是所有过程都适合这种方法。

例如缺陷数、不良率这类“计数型数据”,更适合使用:• P图• NP图• C图• U图

而对于偏态明显的数据,可以考虑:• I-MR图• 百分位控制• 非参数控制图

如果是小批量、变化慢、希望更早发现趋势的过程,则可以考虑:• EWMA• CUSUM

真正成熟的SPC,并不是“所有过程都用同一种图”,而是根据过程特点,选择真正适合的监控方式。

06Six

最不同类型的“非正态”,处理方式其实不一样

很多企业一发现非正态,就急着问:“那控制线到底该怎么设?”但真正关键的是:先分清楚,你遇到的是哪一种非正态。

情况1:过程基本稳定,只是轻微非正态:这是现场最常见的情况。

虽然数据不是特别标准的“钟形曲线”,但过程整体仍然比较稳定,没有明显漂移或异常波动。这种情况下,很多时候仍然可以继续使用传统的 3σ 控制线。因为控制图对“轻微偏态”其实并不太敏感。

现实中的很多工业过程,本来就不可能像教科书里的正态曲线那样完美对称。只要过程稳定、风险可控,控制图依然是有效的。

情况2:明显偏态

例如电镀厚度、涂层类数据,偏态通常会比较明显。

这时候,可以考虑做适当的数据变换。例如:

• Box-Cox:适用于轻中度偏态• Johnson变换:适用于更复杂的非正态情况

变换后,再建立控制线。但这里有一个非常重要的问题:变换后的结果,最终必须还能回到“工程语言”。

因为现场真正需要理解的是:“这个厚度有没有风险?”而不是:“变换后的统计值有没有超限?”如果统计结果现场人员根本看不懂,那么再复杂的模型,也很难真正落地。

情况3:严重非正态

有些过程,本来就不适合硬套正态分布。

例如寿命、漏率、时间类数据,它们天然就可能存在长尾、偏态甚至极端值。

这时候,与其强行正态化,不如直接采用“百分位控制”的方式。例如使用:

• P1• P99• Median(中位数)

来建立过程控制范围。这种方法往往更贴近真实过程风险。

情况4:过程本身存在“物理边界”

还有一些过程,因为受到物理规律限制,本身就不可能符合标准正态。例如:• 数据不可能小于0• 自动补偿后的尺寸• 被人为限制波动的过程

这时候,传统3σ控制线很容易失真。因为数据已经不再是“自然波动”,而是被工艺、设备或控制逻辑“限制”过的结果。

这种情况下,更适合采用“工程控制限”。也就是结合:

• 工艺能力• 设备能力• 风险水平

共同设定控制范围,而不是完全依赖统计软件自动生成控制线。真正成熟的SPC,从来不是“所有数据都统一套公式”,而是先理解过程,再决定用什么方式监控过程。

07Seven

很多企业最大的误区:把“规格线”当成“控制线”

这是现场非常常见、但又非常危险的问题。很多企业做SPC时,直接把客户的 USL / LSL(规格上限、规格下限)当成控制线来监控。

也就是说:只要产品还没超规格,就认为过程“没问题”。但实际上,规格线和控制线,根本不是一回事。规格线,更像是“最终底线”,它代表的是:客户最多能接受到哪里。

而控制线,本质上是在监控:过程是不是开始“变坏了”。所以真正合理的控制线,应该比规格线更早报警。因为SPC真正的价值,不是在产品已经超规格后告诉你“出问题了”,而是要在问题真正发生之前,就提前发现过程正在偏移。

否则,等到数据已经超规格才报警,很多时候产品早就已经流到后工序,甚至流到客户那里了。简单来说:规格线是在判断“产品还能不能交”;而控制线是在判断“过程是不是开始失控”。

08Eight

真正成熟企业怎么做?

真正成熟的企业,SPC往往分四层在看很多企业做SPC,还停留在“每天看报表、算Cpk”的阶段。但真正成熟的企业,关注的远远不只是一个统计结果。

第一层是看“过程稳不稳定”:也就是通过控制图,判断现场有没有异常波动、漂移、失控。

第二层是看“过程能力够不够”:例如 Cp、Cpk、Ppk,评估过程距离客户要求还有多少余量,但真正拉开差距的,往往是后面两层。

第三层是“理解过程”,企业开始关注:-为什么会偏态?-为什么会双峰?-为什么会出现长尾?

因为这些现象背后,往往隐藏的不是统计问题,而是真实的现场问题。

第四层:也是最关键的一层,是“过程分层成熟企业不会把所有数据混在一起分析,而是会按:• 模穴• 设备• 原料• 班次

分别监控。因为很多时候,真正的问题不是整体过程不好,而是某一个模穴、某一台设备、某一个班次正在悄悄失控。

09Nine

很多企业最大的误区:不是改善过程,而是“美化结果”

很多企业一看到统计结果“不好看”,第一反应不是去现场,而是想办法把数据“修漂亮”。于是过程变成了:“数据不好看” 想办法让统计结果好看。

但真正成熟的企业,逻辑恰恰相反:“统计结果不好看”去理解过程到底出了什么问题。因为SPC真正的价值,从来不是生成一张漂亮报表,而是通过数据波动,看见过程背后的真实风险。

10Ten

TPP如何帮助企业真正解决这些问题

TPP的专家团队们有几十年的咨询经验,曾帮助许多原本没有汽车行业经验的工厂,逐步建立起稳定的项目管理能力和过程控制能力,最终满足不同主机厂对项目开发、过程能力、PPAP、特殊特性、SPC、MSA等方面的要求,包括新能源、传统乘用车、零部件等不同领域客户。

基于这些实践经验,TPP近期推出“六大核心工具项目实战训练营”,不再是单独讲APQP、PFMEA、控制计划、MSA、SPC、PPAP,而是以一个真实项目为主线,把六大工具真正融入项目开发、工艺策划、风险识别、过程控制和量产准备中,帮助企业彻底解决“文件是一套,现场又是一套”的二张皮问题,让六大工具真正落到现场、落到项目、落到日常管理中。

欢迎与TPP工作人员联系,了解训练营详情,让六大核心工具真正成为企业项目成功和质量稳定的工具,而不只是几张表格。



订阅

注册将获得TPP咨询中国电子简报

订阅

洞见

  • 智审核和智快反免费体验!

  • TPP四月论坛专家深度解析智能制造的下一阶段

  • 西门子HM26释放重磅信号:AI正在改写工业逻辑

  • 企业经营最大的风险:质量体系与现场脱节

  • SPC里最危险的,不是“非正态”,而是你根本没看懂现场

  • 当AI开始介入,设计工程师真正的价值在哪里?

  • 国内汽车主机厂组织调整的趋势与方向

  • 国外汽车主机厂组织调整的趋势与方向

  • 8分钟讲清六大核心工具真正的逻辑

  • IATF16949质量管理体系失效的真相