¿Cómo se puede asignar con precisión una probabilidad a un evento muy poco probable?

Nota: contestaré esto desde el punto de vista bayesiano.

La noción de probabilidad precisa es algo engañosa. mi probabilidad no es más precisa que la tuya y la tuya no es más precisa que la mía, ya que la probabilidad es un estado de creencia .

La probabilidad es un lenguaje que utilizamos para expresar nuestra falta de conocimiento de un evento (o conjunto de eventos o eventos condicionales). Por ejemplo, si sabe que la moneda está acuñada de manera que cada vez que la lance, saldrá de la cabeza, entonces asignará P (H) = 1. Esto se codifica como un conocimiento perfecto. Mientras que si no sabes nada, entonces asignarías P (H) = 0.5. También deberíamos poder asignar la probabilidad al tipo de evento de cisne negro, y se hace más evidente por qué usamos la probabilidad subjetiva (o bayesiana).

La palabra para la gente que da una “probabilidad precisa” está bien calibrada . Si usted es una persona bien calibrada y usa el rango del 80% (P10 a P90) para asignar una probabilidad, debe corregir 8 de cada 10 veces los eventos que está pronosticando.

Para obtener más información sobre cómo realizar la calibración, vale la pena leer las siguientes referencias:

Lichtenstein, SB “Fischoff, y L. Phillips (1982),” Calibración de probabilidades: el estado del arte hasta 1980 “. Sentencia bajo incertidumbre: heurísticas y sesgos : 306-334.

Sí, la verificación de la calibración de los pronósticos de probabilidad forma parte de las estadísticas bayesianas: modelos estadísticos, inferencia causal y ciencias sociales

Estado de la técnica de codificación de probabilidades subjetivas: una revisión psicológica y psicométrica

El punto de un evento de cisne negro no es solo que es raro, sino que es tan importante. El riesgo no suele provenir de la estimación incorrecta de la probabilidad, sino de ignorar el impacto.

Dicho esto, estimar la probabilidad de un evento que nunca ha ocurrido no es difícil. Por ejemplo, si sacó 100 bolas de una urna, con reemplazo, y todas son blancas, entonces podría asignar una probabilidad de bolas negras de <1%. Puedes ponerle unos límites superiores.

Pero recuerde, detrás de todas sus estadísticas hay un supuesto de muestreo aleatorio que puede o no ser exacto. ¿Cuál es la probabilidad de que su muestreo se haya roto? Si una bola negra lo dejará en bancarrota, entonces el hecho de ocuparse de ese riesgo debería ser su enfoque, no un ajuste fino si la probabilidad real es realmente del 0,8% o el 1,2%.

Es difícil, si no imposible, al menos empíricamente. Esta es una de las razones por las que las pruebas de chi-cuadrado tienen pautas de “conteo mínimo de células”.

Desde la teoría, puedes predecir la ocurrencia con un modelo. La observación del bosón de Higgs es uno de esos ejemplos.

Desde un punto de vista práctico de análisis, el muestreo excesivo es una forma de hacer que el análisis sea más eficiente computacionalmente.

Si tiene suficientes eventos para dar una muestra justa del evento improbable, puede usar la frecuencia empírica como un estimador de la probabilidad. De lo contrario, tiene que usar el enfoque bayesiano que muchos consideran subjetivo, una medida de creencia.

Al aumentar el tamaño de la muestra, tal vez a través de una técnica creativa, como inferir el número de eventos a partir de un conteo de efectos. Por ejemplo, así es como estimamos las huelgas de meteoritos.

Muy fácil, solo dame un inmenso, un fabuloso poder de cálculo; Dame un ejército de investigadores, un inmenso, un fabuloso ejército de detectives y podré predecir todo para ti. ¿Cómo?
El ejército proporcionará a la sede de mi centro de computadoras toda la información necesaria y la computadora te mostrará el cisne negro más hermoso que hayas visto. Veamos un ejemplo a pequeña escala:
Puedo predecir la puntuación final de un partido de fútbol, ​​pero necesito saber TODO sobre todos los jugadores, árbitros, entrenadores, etc. Toda la información del día en que nacieron de manera tan detallada que tengo que saber qué comieron en la cena del 2 de diciembre cuando tenían 6 años.
Es imposible tener todos estos datos, pero si me pueden proporcionar, puedo predecir el futuro.

Si conoces la probabilidad de un evento desigualmente inverosímil, es probable que uno pueda asumir que la probabilidad de que ambos eventos estén bastante cerca.