Demostrar que la solución funcionó: pruebas de hipótesis para quienes se saltaron estadística

By XNM Technologies · November 11, 2021 · 3 min read

Un equipo de recepción en un distribuidor regional estaba convencido de haber resuelto un retraso crónico. Durante 2021, las interrupciones de suministro de la pandemia habían alargado su ciclo de confirmación de pedidos, y tras un cambio de flujo de trabajo los números se veían mejor. La líder de mejora quería cantar victoria. Su Black Belt hizo una pregunta discreta: ¿cómo sabemos que no es solo un buen mes? Para responder eso existe la prueba de hipótesis.

No hace falta un título en estadística para usarla. En las fases Mejorar y Controlar del DMAIC, la prueba de hipótesis simplemente brinda una forma disciplinada de decidir si una diferencia observada es real o podría ser solo ruido. Toda la idea descansa en un hábito mental incómodo al principio pero poderoso: empiezas suponiendo que tu cambio no hizo nada.

Las dos afirmaciones en competencia

Cada prueba plantea dos enunciados. La hipótesis nula dice que no hay diferencia real — el antes y el después son prácticamente iguales, y cualquier brecha es azar. La hipótesis alternativa dice que sí hay una diferencia genuina. Luego preguntas: si el cambio realmente no hizo nada, ¿qué tan sorprendente es el resultado que de hecho vimos?

Plantea primero la pregunta en lenguaje claro. La nuestra fue: ¿el nuevo flujo redujo el tiempo promedio de confirmación? «Promedio» es la palabra clave — apunta a comparar dos medias.
Elige la prueba que corresponde. Comparar la media de un grupo antes y un grupo después sobre una medida continua como horas es una prueba t de dos muestras. Comparar tasas de aprobado/rechazado exigiría en cambio una prueba de proporciones.
Fija el umbral antes de mirar. El equipo eligió el nivel de significancia habitual de 0,05. Decidirlo de antemano te impide racionalizar cualquier resultado que obtengas.
Lee el valor p como una probabilidad de suerte. Estima la probabilidad de ver una diferencia tan grande si el cambio en realidad no hizo nada. Por debajo de tu umbral, rechazas la nula y consideras real la mejora.

El equipo tomó 30 confirmaciones de antes del cambio y 30 de después — suficiente para ser significativo y fácil de reunir. El promedio antes era de unas 19 horas; el de después, de unas 14. La prueba t arrojó un valor p de 0,01. Como está por debajo de 0,05, la conclusión fue clara: una caída de ese tamaño difícilmente era suerte. La solución era real.

Las trampas que engañan a la gente honesta

Confundir «no significativo» con «sin efecto». Un valor p alto a menudo significa que la muestra era demasiado pequeña para distinguir, no que nada cambió.
Tratar el umbral de 0,05 como sagrado. Un valor p de 0,06 no es un fracaso; es una señal para reunir más datos, no para rendirse.
Ignorar la significancia práctica. Un cambio puede ser estadísticamente real pero demasiado pequeño para importar en la operación — pregúntate siempre si la magnitud del efecto justifica el esfuerzo.
Elegir a conveniencia la ventana de tiempo hasta que los números cooperen. Define tu plan de muestreo antes de espiar los resultados.

Lo que marcó la diferencia para este equipo no fue la matemática — el software hizo el cálculo en segundos. Fue la disciplina de plantear la pregunta, elegir la prueba y comprometerse con un umbral antes de mirar. Esa secuencia convirtió una anécdota esperanzadora en evidencia defendible ante un director de operaciones escéptico. El cambio se mantuvo, y cuando un ajuste posterior no superó la misma barra, el equipo tuvo la confianza de revertirlo en lugar de lanzar una no-mejora.

La prueba de hipótesis no se trata de ser astuto con los números. Se trata de ser honesto sobre la incertidumbre — de negarse a confundir una racha afortunada con una ganancia duradera. Para cualquier equipo que intente probar que una mejora vale la pena conservar, esa honestidad es el punto entero.

Si su equipo hace cambios pero no puede probar cuáles funcionan de verdad, la asesoría estratégica de XNM puede ayudarle a construir la disciplina de medición que separa las ganancias reales del ruido.

Demostrar que la solución funcionó: pruebas de hipótesis para quienes se saltaron estadística

Las dos afirmaciones en competencia

Las trampas que engañan a la gente honesta

Artículos relacionados

Cuando un sprint se interrumpe: un método de trabajo para equipos Scrum

¿Puedes confiar en tus números? Guía práctica del análisis del sistema…

Acercar a las partes interesadas sin desarmar al equipo