No puedo recomendar ningún libro, pero puedo responder las preguntas en sus detalles. La respuesta es “en absoluto”. La teoría de la probabilidad es parte de las matemáticas. Los teoremas se prueban usando exactamente la misma lógica que otras ramas de las matemáticas. No utiliza razonamiento inductivo.
El razonamiento inductivo es el tema de la inferencia estadística. Por supuesto, las estadísticas hacen uso de los teoremas en probabilidad de la misma manera que los ingenieros usan teoremas en matemáticas. Entonces la teoría de la probabilidad está separada de la inferencia.
No hay pruebas de fundaciones. Las frecuencias de los eventos se utilizan para juzgar las probabilidades de esos eventos. No hay pruebas de que las frecuencias converjan a las probabilidades, ya que el número de intentos tiende a infinito. Puedes probar que probablemente tienden a un límite (que parece bastante circular) y esto se desprende de los axiomas de la teoría de la probabilidad. (Por supuesto, los axiomas ya no son considerados como “verdades evidentes”).
La inferencia frecuente se basa en la idea de que es poco probable que una muestra se desvíe mucho de la población en sus propiedades principales (pero se desviará en formas menores). Esto se basa en la idea (no demostrable) de que las frecuencias tienden a las probabilidades.
- La declaración “si y solo si” aparece a menudo en los libros de matemáticas. Qué significa eso? ¿Por qué no usamos ‘solo si’?
- ¿Qué libros debo estudiar para mejorar mis conocimientos en matemáticas?
- ¿Cuáles son algunos grandes libros sobre la relación entre el arte y las matemáticas?
- ¿Qué libros debo estudiar para mejorar mis conocimientos en matemáticas y física?
- ¿Cuáles son algunos buenos libros o recursos para aprender Análisis complejo y real, desde el nivel elemental hasta el avanzado?
La inferencia bayesiana juzga las probabilidades de manera diferente. Una probabilidad es un grado personal de creencia. Las cosas en las que tenemos tales grados de creencia no tienen por qué ser eventos, aunque podrían serlo. Podrían ser parámetros no aleatorios de una población. Se supone que estos grados de creencia obedecen a los axiomas de probabilidad. Se puede dar una especie de prueba . Frente a las alternativas siempre nos las arreglamos para hacer una elección. Una persona racional debe elegir la que tenga la mayor utilidad esperada. Esto significa que él / ella debe ser capaz de poner un valor en cada elección y qué tan probable es. Evaluamos las probabilidades al elegir entre apuestas imaginarias con probabilidad conocida. Ver Fundamentos de Estadística, LJ Savage (1954). También hay un libro que es el registro de una discusión entre Savage y otros, pero no puedo encontrar la referencia.
Otro enfoque relacionado es elegir distribuciones de probabilidad previas basadas en la teoría de la información. Dado un modelo y un anterior podemos encontrar una distribución posterior. La información mínima de entradas previas si maximiza la diferencia entre la información de Shannon en la parte posterior y anterior.
Lo siento, no tengo muchas referencias, pero espero que esto ayude un poco.