¿Hay un número “óptimo” de pruebas que uno debería tener al realizar un experimento?

No hay un límite superior para la cantidad de intentos que necesita, por el contrario, no hay un número mínimo. Por lo tanto, no hay un número “óptimo” de ensayos .

Las cosas importantes en cualquier experimento son el error estándar bajo (es decir, cuánto error debe esperar de su experimento) y la alta precisión (cuán cerca están sus valores finales). La razón por la que no puede tener un número óptimo es porque el error estándar, o la incertidumbre, ya que puede estar más familiarizado con él, es una función monótona del número de intentos: disminuye a medida que aumenta el número de intentos y se aproxima a cero. A medida que el número de pruebas van al infinito. Por lo tanto, cuantas más pruebas tenga, teóricamente tendrá un experimento más sólido, esto es cierto a medida que aumenta la cantidad de pruebas de forma indefinida.

El otro parámetro es la precisión, que es simplemente una medida de cuán cerca están sus valores finales. Una forma de medir esto con precisión es a través de la desviación estándar (que está relacionada con el error estándar) de sus mediciones. Hay buenas explicaciones y fórmulas disponibles en línea, por lo que me perdonará si no las proporciono aquí. Cuanto menor sea la desviación estándar, mejor será su experimento. La desviación estándar también disminuye a medida que aumenta el número de ensayos, pero lo más importante es que depende en gran medida de qué tan cerca estén sus valores experimentales. Si está obteniendo un error muy grande (lo que califica como ‘grande’ depende de usted y de la precisión que desee), luego revise su experimento, corrija los posibles problemas y luego realice más pruebas.

¿Mi consejo? Elija un número factible y vaya con él. Tres medidas, suponiendo que su experimento sea perfecto, suele ser suficiente. Si tienes el tiempo o la energía, ve por diez. Si estás increíblemente motivado, ve por cien. Todo lo que importa es un error estándar bajo: si es demasiado alto para sus gustos, haga más pruebas (y compruebe si puede haber factores que no haya tenido en cuenta).


El consejo anterior es puramente para mediciones físicas, donde asumimos que una muestra siempre es representativa de la población y que el único defecto debe provenir de la forma del experimento.

Un lugar donde esto no es cierto es en la redacción de encuestas, donde ahora tiene la libertad de ejecutar el “experimento”, por así decirlo, en diferentes personas. En esos casos, el problema no es uno de varios ensayos, sino si la muestra es o no una buena representación de la población que está estudiando. Un ejemplo: si está interesado en estudiar los hábitos alimenticios de los estadounidenses pero solo le pregunta a los estudiantes blancos de clase superior qué comen, entonces no recibirá una respuesta que sea válida para todos los Estados Unidos.

Como regla general, el tamaño de su muestra, el número de personas que encuestó, debe ser a) seleccionado al azar, yb) al menos el 10% de la población que desea estudiar. Si desea estudiar a todos los estadounidenses, una población de 300 millones de personas, entonces, en teoría, debería encuestar a 30 millones de personas (¡30 millones de ensayos!) Para obtener una respuesta precisa que pueda considerarse cercana a lo que dirían todos los estadounidenses.

Pero, a un lado la digresión interesante, haga tantas pruebas como quiera cuando intente medir la aceleración física de la gravedad.

En cualquier experimento, asumiendo que sus muestras son imparciales y distribuidas normalmente , la media de sus muestras es la mejor estimación del valor real que se mide y es, en sí misma, distribuida normalmente con una desviación estándar proporcional a la raíz cuadrada del número de muestras:

[math] \ sigma = \ sqrt {\ frac1N \ sum \ limits_ {i = 1} ^ N {(x_i- \ bar {x}) ^ 2}} [/ math]

Por lo tanto, si desea que su valor estimado se encuentre dentro de un cierto rango del valor real, puede calcular la cantidad de muestras que necesita tomar. Es frecuente que las personas intenten obtener resultados con tres desviaciones estándar o [math] 3 \ sigma [/ math]: el valor real debe estar en ese rango aproximadamente el 98% del tiempo. No estoy del todo seguro, pero su expresión citada para el número de intentos parece utilizar una variación de dos sigma.

En el caso de un experimento de física como el tuyo, la variación se debe a errores en la medición que deberían ser imparciales y normalmente distribuidos (a menos que tu experimento tenga un sesgo o un error en particular). Si sus mediciones fueran perfectas, no habría ningún error, y podría conformarse con una sola muestra. En la práctica, múltiples muestras realmente te dan una idea de cuán precisas son tus mediciones …

En el caso de estadísticas como las encuestas de opinión realizadas para las elecciones, el tamaño de la muestra suele ser de aproximadamente 2,000 personas, lo que conduce a un error estándar de aproximadamente [math] \ pm2 \% [/ math] en el porcentaje de la votación. atribuido a cualquier partido dado (asumiendo la falta de sesgo en las preguntas y la distribución normal de la muestra, que para las elecciones son ambos sospechosos). Incluso entonces el error estándar normalmente es ignorado por los medios de comunicación que dan cada punto porcentual desde la última encuesta un significado indebido 🙁