¿Qué tan ciertos son los datos científicos?

Los datos se basan en mediciones y las mediciones se basan en nuestra capacidad para detectar, ver y percibir lo que observamos. No hay una herramienta de medición que mida todo.

Una lista de algunos ejemplos:

  1. Podemos medir distancias por: nuestras partes corporales, palo de madera, barra metálica o láser. Cada herramienta de medición proporciona una tolerancia diferente de nuestra medida: longitud del dedo, milímetros, micrómetros, longitud de onda de la luz.
  2. Somos capaces de observar solo algunas secciones del espectro electromagnético. Normalmente observamos la ‘luz’ que forma parte del espectro electromagnético visible por nuestros ojos.
  3. Lo que percibimos como continuo está hecho de átomos. Cada átomo tiene una envoltura hecha de electrones y un núcleo. Cada núcleo está compuesto de protones y neutrones. Cada protón y neutrón está compuesto de quarks. Y así.
  4. El tiempo es otro enigma. Lo medimos por una serie de herramientas con una precisión cada vez mayor: relojes de agua, relojes mecánicos, oscilaciones de cuarzo, oscilaciones atómicas. Sin embargo, no estamos seguros de por qué existe el tiempo.

Cuando se analiza cualquier medida, nos damos cuenta de que somos incapaces de recopilar datos precisos de cualquier tipo. Somos incapaces de reproducir el universo con precisión.

Cada pequeño error en nuestras mediciones conduce inevitablemente a errores cada vez mayores en nuestras estimaciones del desarrollo futuro del sistema medido. Por lo tanto, no estamos seguros de nada de lo que hacemos 🙂

¿Qué crees que es la ciencia? Si le pregunto “¿cómo sabe que algo es verdad?”, Solo tiene algunas respuestas posibles: a) Lo probé experimentalmente y no encontré nada que sugiera que es falso; b) Alguien más lo ha probado experimentalmente y no encontró nada que sugiera que es falso y estoy de acuerdo con su conclusión; c) Creo que es verdad y por lo tanto es verdad; d) alguien me dijo que es verdad y yo les creo; etc.

TODO lo que sabemos es conocido por una de estas respuestas. Durante mucho tiempo, el descubrimiento de nuevos conocimientos se vio limitado por d). Aristóteles, otros filósofos, la iglesia xian, expusieron declaraciones de lo que creían que era verdad sin probar experimentalmente esos pensamientos para confirmar su validez. Por supuesto, no tenían la tecnología para probar algunas de las preguntas que hacían, pero incluso con la tecnología, estos primeros pensadores no tenían una forma sistemática de probar las ideas para la correspondencia con la realidad objetiva.

El problema con su pregunta es que parece pensar que la fiabilidad de nuestro conocimiento reside en los datos que utilizamos y no en las descripciones de la realidad (las teorías). En ciencia, por diseño, no podemos decir lo que es verdad, solo podemos probar una teoría y encontrarla falsa (completamente errónea o incompleta de alguna manera). En general, no es la calidad de los datos el problema principal. En general, los científicos evalúan la calidad de los datos y hacen declaraciones sobre la probabilidad de que el modelo (o la teoría) sea consistente con los datos.

Tomemos un ejemplo. Para la mayoría de los propósitos prácticos, la ley de gravitación de Newton era (y es) suficiente para explicar la gravedad. Su explicación organizó una gran fracción de las observaciones existentes (datos) en un sistema que condujo a la física moderna. Para hacer esa explicación, tuvo que desarrollar herramientas (cálculo) que se han vuelto esenciales para hacer observaciones de calidad y tesis de calidad. Hasta que Einstein publicó su teoría general de la relatividad (y se confirmó astronómicamente una gran predicción), hubo pocas preguntas que la teoría de Newton no pudo responder. Einstein amplió nuestra comprensión de la gravitación. Para demostrar que su teoría hizo mejores predicciones que la teoría de la gravitación predominante (newtoniana), se necesitaron nuevas observaciones que debían realizarse con precisión.

Creo que esa es la respuesta a tu pregunta. Los datos científicos son lo suficientemente precisos como para demostrar con un alto grado de confianza (que es un término estadístico sobre la calidad de los datos) que la teoría prevaleciente es una mejor explicación de la realidad que la teoría que reemplazó. Al principio, los datos son suficientes para distinguir la diferencia entre dos teorías que compiten entre sí.

No hay una respuesta general a esto. La calidad de los datos en la ciencia depende de muchas cosas:

  • ¿Se definió correctamente la población relevante?
  • ¿Donde los sujetos de datos muestreados correctamente? ¿Es la muestra representativa de la población?
  • ¿Dónde los medios correctos elegidos para recopilar datos (método y herramientas)?
  • ¿Se limpiaron y transformaron correctamente los datos?

Estas preguntas son a menudo mucho más relevantes para las ciencias sociales que para la ciencia exacta. Especialmente la ciencia social depende en gran medida de la interpretación, que ya afecta la recolección de datos. Por supuesto, hay procesos para garantizar la calidad (revisión por pares), y todos los datos deben proporcionarse para el control, pero aún así no todo es siempre correcto, a menudo debido a:

  • Procesos de revisión por pares que no fueron adecuados
  • Cuestiones de muestreo. La mayoría de las universidades trabajan con muestras de conveniencia, que se caracterizan por su disponibilidad más que por su precisión. Por lo tanto, los estudios de ciencias sociales a menudo se basan en poblaciones estudiantiles, que es una selección sesgada para muchos objetivos de investigación.

Afortunadamente, la ciencia también sabe que existen formas de hacerlo: la repetición (realizar la misma prueba en varias poblaciones y en varios contextos) y los meta estudios (analizar los efectos encontrados por los estudios individuales en forma masiva).

En consecuencia: un solo artículo podría no reflejar la realidad, aunque se cumplieron todas las normas. Los estudios de metadatos y la reproducción de resultados, por otro lado, validan el conocimiento recopilado sobre un tema. Por lo tanto, la mayoría de las teorías ampliamente aceptadas en ciencias están bastante bien respaldadas, investigadas y se basan en una complejidad de datos que corrige los problemas de datos individuales.

Los datos son solo datos … no es “cierto”. La certeza de las conclusiones extraídas de esos datos puede medirse estadísticamente. Pero, por lo general, un experimento se realiza muchas veces y se obtiene el mismo icono antes de que estemos realmente seguros.

Todas las medidas están sujetas a incertidumbre. Usain Bolt ha sido medido en 19.19 segundos para el sprint de 200 metros en 2009. En realidad, eso es 19.19 +/- 0.00x de segundo debido a los errores inherentes en el equipo de medición.

Lo mismo vale para la medida de la longitud de cualquier cosa. Puede medir 1650 milímetros, pero las siguientes dos personas pueden obtener 1649 y 1652. No cree que su cinta de medir pueda ser un poco larga o corta o que pueda haberla leído mal.

La diferencia entre la medición del tiempo de 200 metros y la medición de una longitud es que los científicos miden las cosas dos o más veces y toman una media, mientras que al menos intentan evaluar dónde pueden estar los errores experimentales y otros. Si la medición es crítica o ha sido disputada, puede hacerse docenas de veces. Esto elimina algunos de los errores aleatorios que siempre aparecen, ya que algunas mediciones serán bajas y otras serán altas.