统计抽样：写给不想把一切都数一遍的人

By XNM Technologies · July 6, 2021 · 1 min read

统计抽样：写给不想把一切都数一遍的人

当你着手改进一个流程时，几乎从来无法测量全部。逐一核对每一张发票、每一道焊缝、每一段患者候诊时间，既太慢又太贵——而在过去这一年里，团队捉襟见肘、供应受扰，对任何事物进行百分之百检验的意愿只会愈发萎缩。统计抽样就是这样一门学问：考察一个精心挑选的子集，再据此对整体得出可信的结论。做得好时，几百个观测值所能告诉你的，比一次草率的全数清点更多、更快。

在精益六西格玛中，这一做法贯穿于 DMAIC 的测量与分析阶段。在你能断言某个流程有能力、或某项变更确实有效之前，需要的是能公正反映现实的数据。整座大厦都立于一个想法之上：只要样本具有代表性，对样本成立的，对总体也近似成立——而这个“近似”是可以量化的。

为什么样本能胜过普查

测量得更少反而更好，听起来似乎本末倒置，但全面普查会招致它自己的误差。测量成千上万个项目会引来疲劳、走捷径和手法不一致——结果你得到一份完整却悄然出错的数据集。较小的样本让你能仔细测量、校准量具并复核工作。代价是抽样误差，即样本结果与总体真值之间无法避免的差距。统计的意义不在于消除这种误差，而在于度量它，从而知道你的数字值得多大的信任。

抽取一个你能信赖的样本

精确界定总体。 在动手测量任何一项之前，先确定你究竟是从什么之中抽取——上一季度的订单，还是这条产线白班的产出。模糊的总体只会给出模糊的答案。
有意识地运用随机。 每一项都必须有一个已知且非零的入选机会。随手拿走堆在最上面的，是便利抽样，它会悄悄把你正要寻找的偏差带进来。
按问题来确定样本量。 样本越大，误差范围越窄，但成本也越高。明显的效应只需较少数据即可察觉；细微的则需要很多。先决定你需要的精度，再据此确定样本量。
留意隐藏的结构。 如果产出因班次、机台或供应商而异，就要跨这些层抽样，使任何一组都不至于被高估或低估。

有几个陷阱反复绊倒新手。便利抽样——测量手边容易够到的东西——最为常见，也最具破坏性，因为容易够到的东西很少具有代表性。在某一时刻抽样，并假定它在时间上始终成立，则忽视了流程在班次与季节之间的漂移。把大样本与代表性样本混为一谈是经典错误：有偏的方法不会因为收集更多有偏的数据而变好。来自一台失准量具的一万次读数，不过是一个理直气壮、代价高昂的错误。

始终盯住目标。你追求的不是一个完美的数字，而是一项在已知不确定度下站得住脚的决定。声明你的置信水平，报告你的误差范围，并对样本如何抽取保持诚实。一个适度而文档完备、别人能够审计的样本，永远胜过一堆无人能为其担保的、看似可观的数字。

建立起让团队能够信任自身数据、并据以行动的测量纪律，正是 XNM 的战略咨询为致力于改进运营方式的机构所带来的价值之一。

为什么现在买不到车：芯片短缺的通俗解读

July 7, 2021

统计抽样：写给不想把一切都数一遍的人

为什么样本能胜过普查

抽取一个你能信赖的样本

相关文章

为什么现在买不到车：芯片短缺的通俗解读

凭空消失的行动项：建立真正落地的跟进机制

压力来临时：五大 Scrum 价值观在混合团队中的真实样貌