判断非正态,不一定一上来就做复杂计算。很多时候,先把数据“画出来”,就能看出问题。
方法1:看直方图
直方图最直观。它就像把一堆数据排成“山形图”,看看这座“山”长什么样。
如果数据明显一边高一边低,可能是偏态;如果出现两个高峰,可能是双峰;如果一边拖得很长,可能是长尾。这些形状,往往都在提醒我们:数据背后可能有不同的过程来源或异常因素。
方法2:看正态概率图
正态概率图可以理解为:把数据拿去和“标准正态分布”做对比。
如果点大致沿着一条直线排列,说明数据比较接近正态;如果点明显弯曲、翘尾,或者中间断开,就说明它可能不是正态。
方法3:做正态检验
如果需要更严谨一点,可以使用正态检验,例如 Anderson-Darling、Shapiro-Wilk 等。但要注意,检验结果只是一个判断依据,不能替代现场分析。尤其当数据量很大时,哪怕一点轻微偏差,也可能被判定为“非正态”。
所以真正关键的不是软件提示了什么,而是这些数据形状背后,现场到底发生了什么。
最重要:先判断“是否稳定”真正核心:如何处理非正态?
真正重要的,不是“修正数据”,而是理解过程。
方法1:不要强行“正态化”(最重要)
这是很多企业最大的误区。一看到“非正态”,马上开始做各种数学变换,目的往往只有一个——把Cpk变漂亮。
于是过程变成了:“不是正态” → 强行变换 → 得到一个很好看的Cpk。但问题是:统计结果变漂亮了,不代表现场风险消失了。
如果设备本身在漂移、模穴之间存在差异、刀具已经磨损,那么即使通过数学方法把数据“修成正态”,真正的问题依然还在现场。
所以SPC里一个非常重要的原则是:不要为了得到漂亮的Cpk,而做脱离现场的“数学游戏”。真正成熟的SPC,是通过数据去理解过程,而不是通过统计去“美化过程”。
方法2:先分析“为什么会非正态”:这才是真正的核心。
例如出现“双峰分布”时,很多时候并不是统计问题,而是在提醒你:现场可能混了不同来源的数据。
比如两台设备、两个模穴、两种原料的数据被放在一起分析,它们本来就不是同一个过程。这时候真正应该做的,不是整体拟合,而是“过程分层”——把不同设备、模穴、批次分开做SPC。
再例如“长尾分布”,很多时候意味着:现场可能存在偶发异常、设备磨损、刀具失效等问题。这不是统计误差,而是真实过程风险正在暴露。很多时候,非正态本身,就是过程给我们的信号。
方法3:使用适合的控制图
还有一个常见问题是:很多企业不管什么数据,都统一套用 Xbar-R 控制图。但实际上,并不是所有过程都适合这种方法。
例如缺陷数、不良率这类“计数型数据”,更适合使用:• P图• NP图• C图• U图
而对于偏态明显的数据,可以考虑:• I-MR图• 百分位控制• 非参数控制图
如果是小批量、变化慢、希望更早发现趋势的过程,则可以考虑:• EWMA• CUSUM
真正成熟的SPC,并不是“所有过程都用同一种图”,而是根据过程特点,选择真正适合的监控方式。
很多企业一发现非正态,就急着问:“那控制线到底该怎么设?”但真正关键的是:先分清楚,你遇到的是哪一种非正态。
情况1:过程基本稳定,只是轻微非正态:这是现场最常见的情况。
虽然数据不是特别标准的“钟形曲线”,但过程整体仍然比较稳定,没有明显漂移或异常波动。这种情况下,很多时候仍然可以继续使用传统的 3σ 控制线。因为控制图对“轻微偏态”其实并不太敏感。
现实中的很多工业过程,本来就不可能像教科书里的正态曲线那样完美对称。只要过程稳定、风险可控,控制图依然是有效的。
情况2:明显偏态
例如电镀厚度、涂层类数据,偏态通常会比较明显。
这时候,可以考虑做适当的数据变换。例如:
• Box-Cox:适用于轻中度偏态• Johnson变换:适用于更复杂的非正态情况
变换后,再建立控制线。但这里有一个非常重要的问题:变换后的结果,最终必须还能回到“工程语言”。
因为现场真正需要理解的是:“这个厚度有没有风险?”而不是:“变换后的统计值有没有超限?”如果统计结果现场人员根本看不懂,那么再复杂的模型,也很难真正落地。
情况3:严重非正态
有些过程,本来就不适合硬套正态分布。
例如寿命、漏率、时间类数据,它们天然就可能存在长尾、偏态甚至极端值。
这时候,与其强行正态化,不如直接采用“百分位控制”的方式。例如使用:
• P1• P99• Median(中位数)
来建立过程控制范围。这种方法往往更贴近真实过程风险。
情况4:过程本身存在“物理边界”
还有一些过程,因为受到物理规律限制,本身就不可能符合标准正态。例如:• 数据不可能小于0• 自动补偿后的尺寸• 被人为限制波动的过程
这时候,传统3σ控制线很容易失真。因为数据已经不再是“自然波动”,而是被工艺、设备或控制逻辑“限制”过的结果。
这种情况下,更适合采用“工程控制限”。也就是结合:
• 工艺能力• 设备能力• 风险水平
共同设定控制范围,而不是完全依赖统计软件自动生成控制线。真正成熟的SPC,从来不是“所有数据都统一套公式”,而是先理解过程,再决定用什么方式监控过程。
这是现场非常常见、但又非常危险的问题。很多企业做SPC时,直接把客户的 USL / LSL(规格上限、规格下限)当成控制线来监控。
也就是说:只要产品还没超规格,就认为过程“没问题”。但实际上,规格线和控制线,根本不是一回事。规格线,更像是“最终底线”,它代表的是:客户最多能接受到哪里。
而控制线,本质上是在监控:过程是不是开始“变坏了”。所以真正合理的控制线,应该比规格线更早报警。因为SPC真正的价值,不是在产品已经超规格后告诉你“出问题了”,而是要在问题真正发生之前,就提前发现过程正在偏移。
否则,等到数据已经超规格才报警,很多时候产品早就已经流到后工序,甚至流到客户那里了。简单来说:规格线是在判断“产品还能不能交”;而控制线是在判断“过程是不是开始失控”。
真正成熟的企业,SPC往往分四层在看,很多企业做SPC,还停留在“每天看报表、算Cpk”的阶段。但真正成熟的企业,关注的远远不只是一个统计结果。
第一层是看“过程稳不稳定”:也就是通过控制图,判断现场有没有异常波动、漂移、失控。
第二层是看“过程能力够不够”:例如 Cp、Cpk、Ppk,评估过程距离客户要求还有多少余量,但真正拉开差距的,往往是后面两层。
第三层是“理解过程”,企业开始关注:-为什么会偏态?-为什么会双峰?-为什么会出现长尾?
因为这些现象背后,往往隐藏的不是统计问题,而是真实的现场问题。
第四层:也是最关键的一层,是“过程分层”。成熟企业不会把所有数据混在一起分析,而是会按:• 模穴• 设备• 原料• 班次
分别监控。因为很多时候,真正的问题不是整体过程不好,而是某一个模穴、某一台设备、某一个班次正在悄悄失控。
很多企业最大的误区:不是改善过程,而是“美化结果”
很多企业一看到统计结果“不好看”,第一反应不是去现场,而是想办法把数据“修漂亮”。于是过程变成了:“数据不好看” 想办法让统计结果好看。
但真正成熟的企业,逻辑恰恰相反:“统计结果不好看”去理解过程到底出了什么问题。因为SPC真正的价值,从来不是生成一张漂亮报表,而是通过数据波动,看见过程背后的真实风险。
TPP的专家团队们有几十年的咨询经验,曾帮助许多原本没有汽车行业经验的工厂,逐步建立起稳定的项目管理能力和过程控制能力,最终满足不同主机厂对项目开发、过程能力、PPAP、特殊特性、SPC、MSA等方面的要求,包括新能源、传统乘用车、零部件等不同领域客户。
基于这些实践经验,TPP近期推出“六大核心工具项目实战训练营”,不再是单独讲APQP、PFMEA、控制计划、MSA、SPC、PPAP,而是以一个真实项目为主线,把六大工具真正融入项目开发、工艺策划、风险识别、过程控制和量产准备中,帮助企业彻底解决“文件是一套,现场又是一套”的二张皮问题,让六大工具真正落到现场、落到项目、落到日常管理中。
欢迎与TPP工作人员联系,了解训练营详情,让六大核心工具真正成为企业项目成功和质量稳定的工具,而不只是几张表格。