¿Por qué los métodos estadísticos son tan fácilmente mal utilizados o abusados ​​a pesar de que se basan en teoremas matemáticamente probados?

Las matemáticas son la herramienta que utilizamos para modelar nuestro universo. Los modelos son útiles para comprender el mundo que nos rodea, a veces por analogía. Pero los modelos, si bien hacen que las cosas parezcan más simples, dependen de los aspectos específicos de su situación para ser útiles.

Las estadísticas son un campo donde hay muchas situaciones diferentes y muchos modelos diferentes. Tomemos la idea de la media, o medida de tendencia central.

Imagina que tienes dinero en un fondo mutuo. Su rendimiento en tres años es de + 50%, + 50% y -100%. ¿Cuál es el rendimiento promedio? Si sumas los numeradores y luego los divides por tres, obtienes un promedio del 0%, o un punto de equilibrio. Pero si comienza con $ 100, tendrá $ 150, $ 225 y $ 0 en los próximos tres años. Pasar de $ 100 a $ 0 no es rentable.

El problema es que el rendimiento de los fondos mutuos se acumula de forma multiplicativa, por lo que el promedio más preciso sería tomar los tres números (1.5, 1.5 y 0) y multiplicarlos, luego tomar la tercera raíz. Lo que sale a 0, o -100%.

¿Ves lo fácil que es usar el tipo de promedio engañoso? El ejemplo que utilicé era muy extremo, por lo que se podía ver claramente la diferencia y hacer una prueba de cordura. En el mundo real, la diferencia entre el cinco y el seis por ciento es enorme, y usar métodos estadísticos tan fácilmente, que es difícil detectar los chanchullos de forma intuitiva a menos que haga un cálculo rápido por sí mismo.

Yo diría que la respuesta está en la forma en que comienza un teorema típico. Por ejemplo, aquí hay un teorema común visto en los cursos de estadística de nivel de introducción.

“Supongamos que [math] X_i [/ ​​math] para [math] i = 1, 2, \ ldots, n [/ math] son ​​variables aleatorias normales iid con media desconocida, [math] \ mu [/ math], y varianza, [math] \ sigma ^ 2 [/ math]. Luego, si la media de la muestra es [math] \ bar X = \ frac 1n \ sum_ {i = 1} ^ n X_i [/ ​​math], y la varianza de la muestra es [math] S ^ 2 = \ frac 1 {n-1} \ sum_ {i = 1} ^ n (X_i- \ barra X) ^ 2 [/ math], un intervalo de confianza [math] 1- \ alpha [/ math] para [math] \ mu [/ math] viene dado por [math] \ bar X \ pm t _ {\ frac \ alpha 2} \ sqrt {\ frac {S ^ 2} n} [/ math] con [math] t_ { \ frac \ alpha 2} [/ math] un valor crítico de la distribución T de Student “.

Le enseñas ese teorema a un estudiante y a menudo solo ven la fórmula final. Ignoran completamente la parte de “variables aleatorias normales de iid”. Aplican valientemente el resultado sin considerar siquiera si es razonable usar la distribución normal para modelar sus datos. Afortunadamente, este teorema en particular es relativamente robusto a las desviaciones de la normalidad, pero no todos los teoremas de este tipo lo son. Muchos de los errores en las estadísticas son el resultado del viejo adagio: “Cuando todo lo que tienes es un martillo, todo parece un clavo”. Las personas aplican las técnicas que conocen a problemas para los que esas técnicas no son apropiadas porque son las únicas técnicas que conocen.

Los resultados estadísticos siempre deben ser interpretados . Las estadísticas no tienen sentido por sí mismas; son números sin referente, y deben ser colocados en un contexto apropiado para tener un significado. Sin embargo, pocas personas se dan cuenta de cómo son las estadísticas dependientes del contexto, y menos aún tienen una idea adecuada de cómo realizar el trabajo de interpretación de las estadísticas correctamente. Como resultado, la mayoría de la gente toma las interpretaciones de las estadísticas de otras personas a su valor nominal, y nunca deja de preguntarse si esas otras personas han creado (intencionalmente o no) interpretaciones parciales, peculiares o egoístas.

Para comprender una estadística, debemos conocer (y tener respuestas a) las siguientes preguntas:

  • ¿A quién / qué miraron los investigadores? (aka: cual es la muestra que eligieron)
  • ¿A quién / qué pensaron los investigadores que estaban mirando (también conocido como: qué es la población que intentaban estudiar) y la muestra que eligieron es representativa de esa población?
  • ¿Qué comparación intentan establecer o qué diferencia intentan establecer? (las estadísticas siempre tienen la intención de hacer comparaciones o establecer diferencias, o en otras palabras, hacer distinciones ; siempre hay un ‘pero’ o ‘versos’ en una estadística)
  • ¿Es la contradicción hecha realmente significativa en el mundo real? (Es fácil encontrar diferencias que son “reales”, también conocidas como significativas, que no tienen un significado práctico en la realidad)

Así, por ejemplo, desde que estamos entrando en la temporada política, hemos estado escuchando mucho sobre cómo (por ejemplo) Donald Trump ha estado liderando las encuestas del Partido Republicano en aproximadamente un 30%. Eso es una estadística. Pero, ¿qué significa? ¿A quién se está muestreando y qué parte de la población de los Estados Unidos representa realmente? ¿A qué se les pregunta y a qué responden realmente? ¿Cuál es la diferencia que se está haciendo: es decir, el 30% de qué contra qué? ¿Y realmente importa: es decir, se traduce en algún efecto significativo en el mundo?

En el caso del GOP, estoy tentado de decir que están muestreando al grupo equivocado. Las personas que responden tan temprano en el ciclo electoral están altamente motivadas políticamente, lo que (en el caso del Partido Republicano) significa más agitantes de derecha estridentes. Como vimos en el último par de ciclos electorales, eso no se traduce bien en la base general del Partido Republicano; en esas primarias, la mayoría de los candidatos radicales se desvanecieron cuando los republicanos moderados comenzaron a inundar la muestra. Sospecho que la posición real de Trump en toda la base del Partido Republicano está cerca del 5-10%, y las personas como Rubio o Bush tienen mucho mejor apoyo del que parecen tener en estos primeros números. Sin embargo, si eso fuera cierto, tendríamos que preguntarnos por qué esta temporada preescolar agotadora involucra todo este último sondeo ‘sin sentido’. Y la respuesta a eso, creo que tiene un efecto de establecimiento de agenda. Los conservadores de extrema derecha utilizan estos primeros números para convencer a la población de que los candidatos más radicalmente conservadores son más populares de lo que realmente son, estableciendo así el tono de las próximas primarias. Es un uso delicado de estadísticas destinadas a encerrar a la parte en un conjunto particular de interpretaciones.

¿Qué teoremas?

CLT (o la aproximación de Stirling) que dice ~ cada distribución cerca de una distribución normal a medida que aumenta la entrada.

O que cada señal se puede descomponer en señales sinusoidales.

y comienzas a aproximarte sin preocuparte por cómo se vincula el error (o no o se propaga)

O (ab) usar la inducción sin preocuparse por el principio de ordenación de pozos.

(o usar otras herramientas de la lógica de una manera inconsistente)

O tratar de forma imprudente las condiciones epistémicas / ontológicas de su modelo.

O (ab) utilizando operadores que no son asignaciones adecuadas a su espacio.

La lista continúa. El punto es que el abuso ocurre en cualquier lugar, una vez que empiezas a asumir libertades indebidas, ingenuamente o no.

Iré de otra manera a las otras respuestas: las últimas dos décadas (aproximadamente) han visto un crecimiento asombroso no solo en el poder de la computación sino también en la disponibilidad de la computación, lo que ha traído consigo un crecimiento en la disponibilidad de software estadístico. Muchas personas ahora tienen acceso a ambos, pero no tienen ninguna experiencia o capacitación en el uso correcto de los procedimientos estadísticos. El hecho de que ya no sea necesario acercarse a un profesional para “ejecutar los números” significa que muchas personas lo están haciendo cuando no están calificados.

Los teoremas son probados y conocidos, por lo tanto, para manipular el resultado solo necesita manipular la entrada.