¿Se dan cuenta las ciencias más blandas que las ciencias duras (física, química) casi nunca usan valores de p?

¿Se dan cuenta las ciencias más blandas que las ciencias duras (física, química) casi nunca usan valores de p?

En primer lugar, las ciencias son disciplinas, no seres sensibles, y no pueden “realizar” nada.

Dejando de lado la pedantía, la razón por la que la psicología y las ciencias sociales se consideran “ciencias” es porque utilizan el método científico: formulación de hipótesis, pruebas, observación, conclusión. Su aplicación de estadísticas es necesaria para determinar el alcance del efecto de cualquier variable extraña en sus datos.

La prueba de hipótesis (valores de p) se usa para determinar si hay suficiente evidencia en una muestra de datos para inferir que una cierta condición es cierta para toda la población. En cualquier experimento que involucre la prueba de una población de sujetos vivos, habrá una variación en los resultados, porque los seres vivos son complejos e innumerables factores pueden afectar los hallazgos.

La psicología y las ciencias sociales utilizan las pruebas de hipótesis generosamente porque se centran en el estudio de los seres humanos vivos y el comportamiento humano. Me doy cuenta de que no incluye la biología en su lista de “ciencias duras”; la biología también utiliza valores de p. Por ejemplo, supongamos que alimenta el chocolate a un grupo de pollos y luego observa la proporción de sexos en sus descendientes. Si obtienes más hembras que machos, sería un descubrimiento tremendamente emocionante: un descubrimiento fundamental sobre el mecanismo de la determinación del sexo. Pero, ¿cómo determinas que este resultado se debe a que les das chocolate y no simplemente al azar? Valores de p

(ref: Manual de Estadística Biológica)

El pirateo es, de hecho, una preocupación cuando se trata de la validez de los resultados, pero esto no es realmente un defecto de las pruebas de hipótesis, sino una falta de integridad y rigor científico por parte del experimentador.

El uso de estadísticas no invalida el estado de la psicología como ciencia. Los valores P son una herramienta útil, y no deben ser denunciados simplemente porque las ciencias “duras” los emplean de manera menos prominente.

Bien, ¿quién dice que la física no usa valores de p?

¿Sabes cómo el CERN confirmó la existencia del Bosón de Higgs? ¿Sabes cómo LIGO confirmó la detección de ondas gravitacionales?

Tenemos que estar seguros de que lo que medimos son señales y no solo ruido estadístico. Para hacer eso necesitas valores de p!

Aunque es definitivamente cierto que los valores p de la física suelen estar en el orden [math] 10 ^ {- 10} [/ math] o algo así, y no es un número bastante cuestionable como el [math] 0.01 [/ math] utilizado en muchos de estudios estadísticos en las ciencias blandas. Usted no puede p-hackear un número tan bajo.

La premisa de esta pregunta es falsa. Trabajé como asistente de investigación de pregrado en física, así que leí muchos artículos e hice mi propia investigación. Absolutamente utilizamos p-valores. Cada vez que quiera probar una hipótesis, debe calcular un valor p. En física, es cierto que hay muchas preguntas interesantes que no implican probar una hipótesis (como la antigüedad del universo), pero en general, cualquier descubrimiento nuevo implicará un valor p, y los documentos que solo están midiendo las cosas tendrán valores de p en ellas si realmente va y lee el documento completo.

En mi campo actual, finanzas, que es una ciencia social, los valores de p se adjuntan a casi todos los resultados principales. Medir las cosas no es lo suficientemente emocionante como para ser el punto principal de un artículo en finanzas: debe probar si X causa Y, o si está relacionado con Y, o algo parecido a eso en finanzas. Esto significa que necesita un valor de p, generalmente varios valores de p, y que la contribución de su documento depende de estas estadísticas.

Esto no es un problema. Los resultados más emocionantes en física tienen el mismo “problema”. El problema en finanzas no es el uso de valores p, sino la incapacidad de recopilar datos suficientes para garantizar que los valores p sean arbitrariamente bajos. Por lo general, lo que tiene es lo que obtiene en términos de tamaño de muestra. Las preguntas tan importantes en finanzas, como por ejemplo, cómo la amenaza de choques de mercado afecta los precios, qué impulsa el incumplimiento corporativo, etc., pueden ser imposibles de responder más allá de toda duda, o incluso más allá de toda duda razonable. Cuando combina este problema con los problemas de endogeneidad y validez externa, lo que básicamente significa que incluso un valor p arbitrariamente bajo a menudo no convencerá a nadie, tiene una verdadera pesadilla en sus manos.

Así que sí, soy consciente de los métodos estadísticos utilizados en las ciencias duras, y a menudo ayudo a mi novia con temas estadísticos para su investigación en ciencias duras. Sin embargo, este conocimiento es básicamente inútil para mí.

Cuando se busca el punto de ebullición del cobre, en realidad se está observando un promedio de muchas observaciones, por lo que incluso las ciencias físicas tienen sus limitaciones y espectro de confiabilidad; cuando se trata de mediciones extremas, deben ser examinadas y explicadas, y cuando las observaciones se obtuvieron utilizando diferentes métodos, deben conciliarse.

Las ciencias sociales no son solo ciencias debido al uso de estadísticas, sino porque utilizan la observación, la recopilación de los fenómenos observados, la aplicación de las mejores explicaciones disponibles basadas en las hipótesis que se están probando, la consideración de los esfuerzos de falsificación, la publicación revisada por pares, el uso de evidencia de otras disciplinas (por ejemplo, el uso de la datación por carbono, el ADN, etc.), es decir, toda la panoplia de la filosofía de la ciencia. Cada ciencia utiliza juicios humanos determinados por cada profesión en cuanto a técnica y confiabilidad. Las ciencias sociales han demostrado su valor al igual que las ciencias físicas, y ambos se esfuerzan por mejorar. Ambos han tenido períodos de errores, malas interpretaciones y falta de confianza (por ejemplo, “el éter”).

Lo que hace que algo sea una ciencia (o no una ciencia) es la repetibilidad de los resultados empíricos. Esto es lo que necesita controles, aplicación de estadísticas y toda la metodología que ha crecido en cada campo. Aunque las ciencias duras no usan valores de p, sí usan estadísticas, y el uso de estadísticas es lo que hace posible que otros científicos puedan replicar sus resultados (imagine cómo se podría declarar un resultado empírico replicable sin afirmarlo estadísticamente, en casi todos los casos). cualquier campo).

Las ciencias blandas tienen un problema muy discutido con resultados replicables, y hay juegos que se juegan con valores de p. Pero no son los valores p el problema. Es el hecho de que es muy difícil encontrar un resultado no trivial y replicable en esos campos. Y el resultado es que algunos están tentados a hacer trampa.