统计抽样:写给不想把一切都数一遍的人
当你着手改进一个流程时,几乎从来无法测量全部。逐一核对每一张发票、每一道焊缝、每一段患者候诊时间,既太慢又太贵——而在过去这一年里,团队捉襟见肘、供应受扰,对任何事物进行百分之百检验的意愿只会愈发萎缩。统计抽样就是这样一门学问:考察一个精心挑选的子集,再据此对整体得出可信的结论。做得好时,几百个观测值所能告诉你的,比一次草率的全数清点更多、更快。
在精益六西格玛中,这一做法贯穿于 DMAIC 的测量与分析阶段。在你能断言某个流程有能力、或某项变更确实有效之前,需要的是能公正反映现实的数据。整座大厦都立于一个想法之上:只要样本具有代表性,对样本成立的,对总体也近似成立——而这个“近似”是可以量化的。
为什么样本能胜过普查
测量得更少反而更好,听起来似乎本末倒置,但全面普查会招致它自己的误差。测量成千上万个项目会引来疲劳、走捷径和手法不一致——结果你得到一份完整却悄然出错的数据集。较小的样本让你能仔细测量、校准量具并复核工作。代价是抽样误差,即样本结果与总体真值之间无法避免的差距。统计的意义不在于消除这种误差,而在于度量它,从而知道你的数字值得多大的信任。
抽取一个你能信赖的样本
精确界定总体。 在动手测量任何一项之前,先确定你究竟是从什么之中抽取——上一季度的订单,还是这条产线白班的产出。模糊的总体只会给出模糊的答案。
有意识地运用随机。 每一项都必须有一个已知且非零的入选机会。随手拿走堆在最上面的,是便利抽样,它会悄悄把你正要寻找的偏差带进来。
按问题来确定样本量。 样本越大,误差范围越窄,但成本也越高。明显的效应只需较少数据即可察觉;细微的则需要很多。先决定你需要的精度,再据此确定样本量。
留意隐藏的结构。 如果产出因班次、机台或供应商而异,就要跨这些层抽样,使任何一组都不至于被高估或低估。
有几个陷阱反复绊倒新手。便利抽样——测量手边容易够到的东西——最为常见,也最具破坏性,因为容易够到的东西很少具有代表性。在某一时刻抽样,并假定它在时间上始终成立,则忽视了流程在班次与季节之间的漂移。把大样本与代表性样本混为一谈是经典错误:有偏的方法不会因为收集更多有偏的数据而变好。来自一台失准量具的一万次读数,不过是一个理直气壮、代价高昂的错误。
始终盯住目标。你追求的不是一个完美的数字,而是一项在已知不确定度下站得住脚的决定。声明你的置信水平,报告你的误差范围,并对样本如何抽取保持诚实。一个适度而文档完备、别人能够审计的样本,永远胜过一堆无人能为其担保的、看似可观的数字。
建立起让团队能够信任自身数据、并据以行动的测量纪律,正是 XNM 的战略咨询 为致力于改进运营方式的机构所带来的价值之一。