不靠统计学位也能做假设检验：一份大白话入门

By XNM Technologies · April 25, 2021 · 1 min read

假设检验听上去像是非得有统计学位才敢碰的东西。其实不然。它的核心，是用一套有条理的方法回答一个诚实的问题：“这个差异是真实的，还是不过是噪声？”在精益六西格玛DMAIC项目的“分析”阶段，这个问题反复出现——夜班是不是真的更慢，新供应商是不是真的提升了质量——而在2021年，那么多流程被打乱，把真实的变化与随机波动区分开来，成了一项实用的生存技能，而非课堂练习。

用大白话讲清这套逻辑

每一次假设检验都摆出两个相互竞争的主张，然后问数据该信哪一个。你不必动手算任何东西，也能理解其中的推理。

陈述零假设。 这是那个无趣的默认值：“不存在真实差异”。两家供应商表现一样；这次改动没有效果。在证据另有所言之前，你假定它成立。
陈述备择假设。 这是你所怀疑的：“存在真实差异”。新流程更快；缺陷率确实下降了。这正是你想要支持的那个主张。
看p值。 软件会给你一个介于0和1之间的数字。它回答：如果真的毫无差异，那么仅凭偶然出现如此极端结果的可能性有多大？p值很小，意味着“不太可能只是运气”。
与你的阈值比较。 在看结果之前先选定一个临界值——常用0.05。若p值低于它，你就否定零假设，把差异当作真实的；若高于它，你就没有足够证据断言存在差异。

整台引擎就是这些。算术交给软件；你的工作是诚实地把问题框定好，并不抱一厢情愿地去读那个答案。

新手容易栽在哪里

出问题的很少是数学，而是推理。有那么几个陷阱，几乎人人头几次都会踩中。

把“不显著”当成“没有差异”。p值高，意味着你证据不足，而非证明效应确实不存在——往往只是你还需要更多数据。
把统计显著当成重要。样本极大时，你可以证明半秒的差异是“真实的”，而它对客户却毫无意义。
看到结果之后才挑阈值。先定好你的临界值，否则你只是在为想要的答案找理由。
忘了检验的前提是数据采集得公正。一个有偏的样本——比如在2021年被打乱的某个季度里只测量容易的案例——会让任何p值都失去意义。

用得好，假设检验能让精益六西格玛团队保持诚实。它让你不至于为一次其实只是“运气好的一周”而庆功，也让你不至于放弃一项确实有效、却被正常噪声掩成一片平淡的改动。你不需要那些公式；你需要的是把问题问得干净、并尊重答案的那份纪律。

如果您的团队凭直觉做改进决策，又想有把握地把信号从噪声中分辨出来，XNM的战略咨询可以帮助您把这份严谨融入决策方式之中。

为什么最后一公里成本最高：末端配送通俗指南

April 26, 2021

不靠统计学位也能做假设检验：一份大白话入门

用大白话讲清这套逻辑

新手容易栽在哪里

相关文章

为什么最后一公里成本最高：末端配送通俗指南

没人想要的项目管理办公室：一家中型机构在筹建中学到了什么

当冲刺被劫持：一个 Scrum 团队应对冲刺中途打断的故事