¿Por qué es verdad la navaja de Occam?

A diferencia de las otras respuestas, creo que la navaja de Occam es cierta en un sentido universal . (Aunque no sea de utilidad inmediata). De hecho, podemos convertir la afeitadora de Occam en un resultado puramente matemático que solo depende de las propiedades de las distribuciones de probabilidad.

Realmente no soy una persona probabilística o de aprendizaje automático, pero mi lectura de la teoría de la inferencia inductiva de Solomonoff me lleva a creer que las teorías más simples son matemáticamente más probables pero también que este tipo de simplicidad universal es incompatible (es decir, como la complejidad de Kolmogorov).

Aquí hay una intuición aproximada de por qué esto tiene sentido: los modelos más simples tienen descripciones más cortas , y si solo generamos cadenas binarias al azar, es más probable que aparezcan las más cortas .

Básicamente, podemos hacer predicciones óptimas sobre el mundo comenzando con un único universal anterior . Podemos pensar en todos los modelos posibles del mundo como programas alimentados en una máquina universal de Turing. Luego simplemente asignamos probabilidades a los programas en función de sus longitudes. Antes de que tengamos alguna observación, simplemente asumimos que un modelo del universo se basa puramente en lo simple que es; a medida que obtenemos más observaciones, simplemente actualizamos nuestra probabilidad en base a esas observaciones, pero aún a partir del universal anterior.

Lo bueno es que este anterior universal simplemente surge matemáticamente de cómo funcionan las distribuciones de probabilidad. ¡Ni siquiera es una ley de la física sino un resultado matemático!

Esta noción de asignar probabilidades en función de la longitud de un programa (es decir, una cadena binaria) se denomina probabilidad algorítmica . Se presenta en un artículo sorprendentemente legible por Ray Solomonoff: “¿La probabilidad algorítmica resuelve el problema de la inducción?”. Por extraño que parezca, ¡rompe la ley de titulares de Bettridge!

Tener una máquina de Turing universal en particular puede parecer algo arbitrario. Afortunadamente, resulta que la máquina exacta que utiliza no importa hasta un factor constante: la probabilidad algorítmica es invariante de la máquina.

La única pega es que este es un resultado puramente teórico . Resulta que la probabilidad algorítmica es completamente incomputable . Además, si bien podemos aproximarlo, saber qué tan cerca está la aproximación también es incompatible . Podemos calcularlo lo más cerca posible en un momento dado con algunos recursos dados, lo que lleva a una probabilidad limitada de recursos que, aunque no es teóricamente satisfactoria (después de todo, nunca podemos saber qué tan buena es una aproximación) resulta útil en la práctica. .

Así que diría que la navaja de Occam tiene sentido porque es una propiedad fundamental de las distribuciones de probabilidad que emerge puramente matemáticamente. Si bien la teoría real termina siendo incomputable, puede ser aproximada por varias heurísticas como la navaja de afeitar clásica e informal de Occam.

Porque no es cierto en ese sentido.

No se trata de “la explicación más simple”, eso es vago y ondulado a mano.

Se trata de elegir la teoría científica más funcionalmente simple de muchas teorías en competencia que producen predicciones equivalentes. La mayoría de las cosas nunca llegan al muro de las maquinillas de afeitar: se falsifican o se demuestra que no se pueden probar, y por lo tanto no tienen sentido, mucho antes.

Esto es lo que tiene que tener una teoría:

  • Realiza predicciones falsificables con una precisión constante en una amplia área de investigación científica (como la mecánica).
  • Está bien respaldado por muchos aspectos independientes de la evidencia, en lugar de una sola base. Esto asegura que probablemente sea una buena aproximación, si no es completamente correcta.
  • Es consistente con teorías preexistentes y otros resultados experimentales. (Sus predicciones pueden diferir ligeramente de las teorías preexistentes en los casos en que son más precisas que antes).
  • Puede adaptarse y modificarse para dar cuenta de la nueva evidencia a medida que se descubre, lo que aumenta su capacidad predictiva con el tiempo.
  • Es una de las explicaciones más parsimoniosas, evitando en las entidades propuestas o explicaciones.

– Teoria cientifica

La maquinilla de afeitar de Occam solo debe aplicarse cuando tiene 2 teorías que compiten entre sí y ambas predicciones equivalentes en todos los datos actuales.

Por ejemplo, aquí hay 2 aproximaciones del siguiente conjunto de datos (con la ayuda de Joshua Engel):

[math] y = x [/ math]

Y

[math] y = x ^ 2 [/ math]

Ambas teorías evalúan a [math] y = x [/ math] para 2 de los valores pequeños de [math] x [/ math] ([math] x = 0, 1 [/ math]) y ambas hacen predicciones equivalentes sobre el estado de y, dada la entrada x para todos los valores pequeños de x. Ambos son falsificables, consistentes con teorías preexistentes, modificables a otras funciones y bien soportados. Ambas son buenas teorías.

¿Cuál deberíamos elegir si lo que queremos es la función que más simple, y con el menor número de suposiciones en adelante, representa mejor los datos actualmente disponibles?

Claramente esto es [math] y = x [/ math].

La máquina de afeitar de Occam es simplemente la aplicación de la simplificación a teorías en competencia que producen predicciones equivalentes para todas las entradas a un denominador común funcional.

Pero es solo una heurística: con los nuevos datos, el modelo más simple puede, de hecho, ser falsificado, y la máquina de afeitar de Occam elegirá la teoría equivocada, si se le dan las entradas incorrectas (entrada de basura, salida de basura).

La navaja de afeitar de Occam se utiliza para juzgar entre las teorías que ya han pasado las pruebas de “escrutinio teórico” y que están igualmente bien respaldadas por la evidencia.

– La navaja de Occam

Así que solo separa las teorías por complejidad y nada más. Si las teorías no han pasado las pruebas técnicas de antemano y los datos son falsos, Occam elegirá la teoría equivocada, ver más abajo.



Entonces, piénselo así, la navaja de Occam elegirá a Newton por encima de la Relatividad hasta que descubramos que Mercury se tambalea. Luego se falsifica a Newton (ya no se alimenta en la máquina de afeitar), y gana la Relatividad, siendo la Relatividad el mejor nuevo caso base, y todo lo demás es secundario hasta que se falsifique la relatividad (teoría de cuerdas, etc.).

Aquí es por qué realmente lo usamos:

¡La navaja de Occam volvería a elegir [math] y = x [/ math] sobre Aliens! si el único dato que nos dieron fue confirmar la opinión de alguien de que los extraterrestres hicieron algo. Ahora, los nuevos datos pueden falsificar esto, pero hasta nuevo aviso, [math] y = x [/ math] y no Aliens!

La máquina de afeitar de Occam cuando se usa correctamente elimina el número infinito de teorías de mierda que es más probable que sean falsas debido al mayor número de suposiciones que las subyacen y al riesgo probabilísticamente mayor de que puedan falsificarse. Ahora, estas teorías pueden ser ciertas (no se puede eliminar la posibilidad), pero hasta que [math] y = x [/ math] sea falsificada, la elegimos. Una vez que los nuevos datos salen a la luz, a la navaja de Occam se le deben dar los nuevos datos y teorías que aún no se han falsificado para elegir la mejor basada en el conocimiento actual.


La mayoría de los cambios en las teorías aceptadas no se deben a que la afeitadora de Occam los escogió, sino a que los datos falsificaron la teoría anterior que la afeitadora de Occam escogió para una más nueva, convirtiendo al antiguo en simplemente un modelo útil, y eliminándolo de la discusión (falsificado).

Mecánica newtoniana vs. relatividad:

Fenómenos: lentes gravitacionales + todas las manifestaciones físicas previas observadas actualmente.


– Lente gravitacional

Newtonion: No predice lentes gravitacionales. Falsificado.

Relatividad: hace ambas cosas. Aceptado como nuevo modelo de realidad.

La navaja de Occam: la relatividad gana cuando Newton ya no está en la carrera. Newton fue relegado a un modelo útil (evite movimientos que se mueven rápido siempre que sea posible). La relatividad espera la falsificación como un nuevo caso base para comparar otros en contra.

Teoría del germen vs. Teoría del miasma:

Fenómenos: las personas mueren de cólera cerca de lugares malolientes o malolientes.

– Brote de cólera en la calle Broad de 1854.

Miasma: no predice la distribución de muertes en lugares igualmente malolientes o no olorosos cerca de un suministro de agua infectado. Falsificado.

Germen: Hace. Aceptado como nuevo modelo de realidad.

La navaja de Occam: la teoría de los gérmenes gana cuando Miasma está ahora fuera de la carrera. Miasma relegado a modelo útil (las cosas malolientes son peligrosas para ti). El germen espera la falsificación como un nuevo caso base para comparar otros (comparado con el progreso en microbiología)

Teorías sobrenaturales vs. Principio de precaución en el razonamiento humano.

Fenómenos: cualquier cosa inexplicable a menudo se dice que es causada por algún tipo de agente consciente por los humanos. ¿Por qué esto es tan?


Teorías sobrenaturales: en realidad hay agentes, pero no hay evidencia. No explica nada. Untestable No especifico Contradictorio. No consistente. No bien apoyado. No falsificable. No es una teoría. Falso.

Principio de precaución: mecanismo de respaldo evolutivo que explica por qué las personas asumen automáticamente que algún agente desagradable está detrás de acciones inexplicables para mantenerlas con vida bajo el principio de riesgo de precaución.

– Principio de precaución

Ejemplo:

Caminando en la jungla, hay un susurro en los arbustos – 2 opciones:

a) Nada.

b) ¡Tigres o Aliens! – ¡corre, tonto!

Los que asumen tigres / Aliens! – Corre y vive más que los que no lo hacen – que mueren.

La navaja de Occam: las teorías sobrenaturales nunca se consideraron, ya que no son teorías científicas que hacen predicciones útiles (Dioses / Fantasmas / Espíritus / Exorcismos / Extranjeros / Cualquier otra cosa que sea una tontería).

Principio de precaución aceptado como modelo.

Todas las teorías posteriores fueron más complejas que sus precedentes. Sin embargo, todos explicaron los fenómenos precedentes y nuevos con mayor precisión y predicciones más precisas. La navaja de Occam se aplica a las nuevas teorías (y su competencia) para elegir la forma funcional más simple que explique los fenómenos con la menor cantidad de fondos, para ayudar a producir áreas de interés para la generación de nuevas teorías y para proporcionar un caso base contra el cual otras. Las teorías pueden medirse contra sí mismas.


Renuncia:

La cuchilla de Occam no es más que un filtro final y, según su interpretación, puede ir desde una heurística hasta un sinónimo más colorido del método científico.

Apéndice:

Todos los modelos son falsos pero algunos son útiles.

http://en.m.wikiquote.org/wiki/G

Y aquí está Isaac Asimov, una vez más, robándome el trueno en una década más o menos con su artículo “Relativity of Wrong”, que recientemente he tenido el placer de leer: The Relativity of Wrong

Nota:

Si has llegado tan lejos de la respuesta, la has disfrutado y te gustaría ver más cosas así, entonces deberías seguirme aquí: Anirudh Joshi

Aquí está mi opinión sobre la pregunta, con un extracto de mi libro:

El principio de parsimonia : la navaja de Occam
En el siglo XIV, un monje, Guillermo de Ockham, reflexionó sobre la teología de su Iglesia y las razones propuestas para creer en la existencia de Dios. Por su introspección torturada, no pudo encontrar un apoyo racional para creer en su Dios, pero llegó a una verdad universal con su meticuloso proceso, y aún es una herramienta poderosa de pensamiento científico hasta el día de hoy. El Principio de Parsimonia de William de Ockham es Aquí reformulado en lenguaje moderno por el filósofo Bertrand Russell:

Al considerar las hipótesis, no se debe suponer que existen más cosas de las que son absolutamente necesarias.

William abogó por esta regla empírica en lo que llamó su teoría del conocimiento. Él razonó a partir de la parsimonia de que el conocimiento divino no puede lograrse únicamente por deducción lógica. Su escepticismo, al que conduce esta parsimonia ontológica, aparece en su doctrina: que la razón humana no puede probar la inmortalidad del alma ni la existencia, la unidad y la infinidad de Dios. Estas verdades, nos enseña, nos son conocidas solo por la Revelación. Por tales enseñanzas heréticas, Occam fue vilipendiada por la Iglesia y huyó por su vida, desde el asiento papal, que estaba en Aviñón. De hecho, finalmente fue excomulgado. (Su nombre era y todavía se deletrea de manera variada, como era común en ese entonces). Nacido en inglés, William of Ockham se convirtió en un monje franciscano y murió enfermo e indigente en Munich en un momento de plaga (alrededor de 1347-9).
Algunos estudiosos ahora malinterpretan la parsimonia como el principio de KISS : sea ​​sencillo, estúpido . Esto no es correcto. Si bien es cierto que a menudo hay un valor inherente en la simplicidad, la explicación que elija aceptar debe encajar en toda la evidencia . El principio de la parsimonia, o el uso de Occam’s Razor, no favorece una explicación simple sobre el complejo, simplemente para evitar las complicaciones de la complejidad. No. Parsimonia significa que cuando ninguna evidencia favorece una hipótesis sobre otra, la elección más robusta es la más directa, la que no requiere coincidencias improbables, agentes desconocidos o seres sobrenaturales .
Esta distinción entre la simplicidad (el principio KISS ) y la parsimonia (evitar agentes extraños) para explicar algo, no es menor, y lleva a conclusiones dramáticamente diferentes dentro de nuestro propio pensamiento en nuestras vidas normales. Por ejemplo, si tuviéramos que explicar el comienzo de la Humanidad (una pregunta compleja) de una manera simple y definitiva (muchos no pueden tolerar la incertidumbre), terminaríamos con un mito de creación similar al de las muchas religiones del mundo. (Tenga en cuenta que solo porque muchas personas estimadas hayan llegado de forma independiente a la misma respuesta a una pregunta no significa que la respuesta simple sea cierta). De hecho, esa respuesta simple puede ser apropiada para las mentes de los niños muy pequeños. (Y tengo mis dudas de que incluso esto es cierto).
La parsimoniosa respuesta es decir que de todas las hipótesis que los mejores pensadores del mundo han ideado, en los miles de años de nuestra existencia, la teoría de la evolución de Charles Darwin y Alfred Wallace (y nuestra extensión moderna de ADN) se ajusta a más datos y tiene las menores suposiciones, menos especulaciones y ninguna hada del cielo mágico que cualquier otra teoría hasta ahora examinada.
Ahora puede ver que, incluso cuando se nos proporcionan los mismos datos, nuestras conclusiones pueden ser diferentes, dependiendo de nuestra forma de pensar: desde la Edad Media hasta el presente, para ser precisos. La pregunta es: ¿qué tan lógica es tu forma habitual de pensar? En un universo alternativo, Clint podría haberse reformulado como Harry el sucio : “¿Piensas lógicamente – Punk?”
La parsimonia es una forma metafísica de saber . Sin información completa, y en el rostro siempre presente de la incertidumbre, el parsimentario dice esto: acepte la explicación más directa que se ajuste a los datos. Normalmente, una explicación parsimoniosa tiene menos pasos evolutivos y necesita menos mecanismos de enlace, desde una causa inicial hasta su efecto inmediato y consecuencias lejanas. Dado que las hipótesis son siempre provisionales, se expresan mejor en una forma comprobable cuando también son parsimoniosas.

Sabemos que la parsimonia funciona, porque una y otra vez se encuentra que las explicaciones parsimoniosas son más sólidas, más útiles y duran más que las alternativas más imaginativas.

Ahora en cualquier dominio siempre habrá hipótesis alternativas. Si tiene que evocar provocaciones vagas, seres extraños, agentes desconocidos e invisibles o pasos extraños y complicados, entonces es menos probable que sea una explicación verdadera y correcta que una alternativa con una conexión directa, causal y mecanicista.
El principio de parsimonia se aplica ampliamente en la ciencia. De hecho, cada uno de nosotros lo usamos como regla general en al menos algunos aspectos de la vida cotidiana. A pesar del uso común, muchas personas seguirán optando por lo fantástico y lo sobrenatural como su explicación personal de los aspectos complejos de la naturaleza. Las hadas, los trolls, los dioses, la magia, los animales míticos, etc., en nuestro folklore tienen este origen fantástico. Nuestros antepasados ​​no sabían nada mejor: ¿cuál es tu excusa? Demasiadas personas aún se aferran a las improbables explicaciones que involucran seres extraños con poderes mágicos. Se están librando guerras en estos puntos mientras hablamos (incluido Afganistán). La religión, Hollywood y los cuentos infantiles están repletos de explicaciones sobrenaturales de los fenómenos ambientales naturales. Tales cuentos de aquellos en autoridad implican que tales historias de hadas son verdaderas. Como resultado de esto, y de nuestra creciente población, ¡hay más personas ahora que creen en alguna versión del hada del cielo mágico, el ocultismo y lo sobrenatural que en cualquier otro momento de la historia humana!
Como antídoto a la irracionalidad, intente leer a Bertrand Russell, quien expresó este principio hace más de ochenta años en Ensayos escépticos : “Que no es deseable creer en una proposición cuando no hay motivos para suponer que es verdad”. Mi opinión al respecto es la siguiente:

Cuanto más complejo sea un tema, más usted como escritor necesita simplificarlo para los lectores. No distorsionando la complejidad, no derribándola. No, aclare el problema alcanzando su núcleo y eliminando premisas falsas con la navaja de Occam.

Tu consulta de mi respuesta rápida a la navaja de afeitar de Occum, ahora me ha hecho pensar más profundamente. Ahora puedo ver que quería una afirmación concreta de “por qué funciona”, en lugar de mi explicación que equivale a “porque en la práctica lo hace”. De hecho, es razonable que espere más, incluso si la mayoría de nosotros normalmente conformarse con la primera explicación lógica que se nos ocurre.

Ahora que analizo el tema con mayor profundidad, he encontrado una idea de una afirmación más concreta de por qué funciona la afeitadora de Occum. Es en la forma de un experimento mental. Usaré un ejemplo de un conjunto simple de datos extraídos de solo dos variables, una causa y su efecto probable. Considere estas medidas de datos biológicos, ya que todos estamos familiarizados con nuestros propios cuerpos y la variabilidad comúnmente experimentada entre dichos datos de al menos el 20%. Dibujamos medidas de la variable causal o independiente X, y la trazamos cuidadosamente contra los datos del efecto o la variable independiente Y. La primera ecuación o hipótesis simple que pruebe en estos datos podría ser un ajuste de mínimos cuadrados a los datos en el formulario de una línea recta para que: Y = a + bX.
De hecho, esto podría ser bastante satisfactorio, ya que la mayoría de los datos Y se predicen a partir de X, digamos 80%. Pero la predicción no es perfecta, algunas de nuestras predicciones están a la deriva, en lo que equivale colectivamente a un grado de error. Por lo tanto, la correlación es menos que perfecta, r = 0.9. Si somos astutos y conocemos suficiente biología, también podríamos conocer un mecanismo causal entre X e Y. Esto generalmente nos permitirá suponer cuál es realmente el mecanismo de enlace, los análogos biológicos de los coeficientes a y b . Luego podemos medirlos para verificar esta relación biológica, en un experimento (o serie de experimentos).
Ahora, un perfeccionista (o un físico) podría insistir en que tal predicción o correlación es inadecuada y que podemos hacerlo mejor con una ecuación o hipótesis más compleja, tal vez utilizando un polinomio de algún derivado de X.
Convenientemente usaremos la forma de energía: Y = a + b1X + b2X2 + b3X3 … bnXn.
Dicha hipótesis o ecuación (con suficientes iteraciones) producirá una correlación o predicción casi perfecta entre cualquiera de las dos variables (no aleatorias), con cualquier error práctico reducido a casi cero.
“Perfecto”, dices.
No exactamente. Lo que ha perdido aquí en esta explicación hipotética es su capacidad para vincular causalmente las dos variables a través de los coeficientes biológicamente conocidos que tenía antes en el anterior, lineal más simple de: ay b .
Su hipótesis polinómica ahora contiene coeficientes abstractos que probablemente no tienen un análogo real en el mundo biológico. El mecanismo de vinculación de causa y efecto que tenía anteriormente se pierde, y ahora estamos tratando con coeficientes que son el equivalente de lo que podrían ser agentes sobrenaturales en otros problemas. (Si piensa de nuevo, puede darse cuenta de que la naturaleza irreal o abstracta de las matemáticas, y la pérdida de un vínculo causal, fue un problema crítico con los derivados financieros que causaron la última Crisis financiera mundial).
“Está bien”, dice, “no sabemos cuáles son realmente los coeficientes (detalles) de nuestra nueva y brillante hipótesis, pero estas predicciones tan precisas en biología podrían salvar vidas”.
No otra vez. No exactamente. Lo que hicimos antes fue generar datos y aplicar nuestra hipótesis retrospectivamente. Ahora, en el futuro, cuando vuelva a aplicar este análisis a nuevos datos, medidas extraídas de otras personas, tal vez incluso de las que aún no han nacido, que vivirán en una nueva era con un entorno diferente, diferentes trabajos, diferentes alimentos, etc.: ¿Qué hipótesis cree usted? te dará la mejor forma? ¿Qué hipótesis es probable que sea más sólida en circunstancias nuevas y desconocidas?
Resulta que este tipo de experimento se ha realizado antes, muchas veces, en todos los campos (incluidos la física y la cosmología, así como la biología). El mejor predictor resulta a menudo ser la versión más simple que se ajusta a casi todos los datos, la forma en que se sabe qué significan los vínculos causales (coeficientes) en el mundo real. Ahora, exactamente por qué las matemáticas resultan de esta manera, está mucho más allá de mi entrenamiento o poder lógico de deducción. (Y también es cierto que uno puede seguir respondiendo la pregunta del por qué de cualquier explicación hasta que finalmente no haya una respuesta conocida).
Lo que tenemos aquí en mi explicación es al menos una aproximación a la pregunta de por qué el principio de parsimonia, o la navaja de Occam, funciona tan bien como lo hace en la vida real. Quizás alguien, en algún lugar, reconstruirá uno mejor. Por favor, dime si lo hacen!

Debido a que las teorías no están determinadas por los hechos, los científicos se enfrentan al problema de seleccionar entre teorías alternativas que coincidan con los datos disponibles. La maquinilla de afeitar de Occam es un principio utilizado en tales situaciones, y es “verdadera” en el sentido de que ha demostrado ser muy útil a lo largo del tiempo para seleccionar la teoría más comprensible y empíricamente sólida. ¿Cuál es la razón para esto? Primero, la teoría que involucra menos suposiciones innecesarias nos proporciona una comprensión más simple y clara que las otras, y por lo tanto es más comprensible. En segundo lugar, es menos probable que la teoría más simple sea falsificada por nuevos datos, ya que implica menos suposiciones que pueden resultar incorrectas. Por lo tanto, es más probable que se demuestre que es robusto.

Como mencionó el usuario de Quora, “la navaja de Occam no es cierta, es útil”.

La razón por la que es útil se puede ver al ver cuán inútiles son agregar suposiciones innecesarias.

Estoy seguro de que puede llegar a un montón de suposiciones inútiles a teorías por lo demás parsimoniosas. Este es un ejemplo terrible de la parte superior de mi cabeza: agregar el peso de las hadas, que siempre es menos perceptible, al peso de cualquier objeto en los cálculos gravitacionales.

No descartaría la explicación “termodinámica”, pero preferiría decir que la Maquinilla de afeitar de Occam es un tipo de sesgo antrópico basado en las limitaciones cognitivas humanas y una preferencia estética, dentro de la filosofía de la ciencia, por explicaciones que son lo suficientemente complejas. ser comprensivo pero lo suficientemente simple como para ser comprensible . Así que estamos preparados para encontrar el “punto óptimo” entre esos dos requisitos, pero no necesariamente existe “en realidad”.

La demostración “empírica” ​​del aprendizaje automático puede ser engañosa, ya que la “complejidad” de una “explicación” está sujeta tanto a limitaciones técnicas (representativas) como a la capacidad de los humanos para reconocer las estructuras como explicaciones.

¿Cómo podríamos poner esto sobre una base empírica? Supongamos que hacemos una analogía de que las explicaciones en ciencias naturales son como teoremas matemáticos, validados por pruebas. Tenemos pruebas que tienen cientos o miles de páginas, y en el pasado no habrían sido aceptadas (o descubiertas) por matemáticos, pero que ahora están sujetas a construcción mecánica y verificación por computadora (con algunas limitaciones como problemas de terminación). Esto elimina el problema de la “limitación cognitiva”. Supongamos que luego generamos teoremas con variaciones por algunos métodos de programación evolutivos, tratamos de probarlos, luego mantenemos estadísticas sobre la longitud de las pruebas y la longitud de los teoremas. El problema es que todavía no sabemos si nuestro generador produjo una buena muestra de “todas las explicaciones” o si favoreció a las simples. Tal vez alguien familiarizado con la filosofía de las matemáticas podría aclararme esto.

Debes tener en cuenta que Occams Razor es solo una heurística.

La respuesta de Nathan Ketsdever a ¿Qué justificaciones científicas o filosóficas existen para la navaja de Occam?

Minimice las suposiciones … asume que sabe lo que es importante. Se supone que has investigado las cosas correctas.

Con el tiempo, si se repite, parece dar resultados de calidad.

Creo que para los científicos puede ser útil, pero para los empresarios no siempre es útil si está buscando algo perturbador. Sin embargo, todas las cosas son iguales, pero es útil eliminar las suposiciones cuando sea posible.

Definir “verdadero”.
La cuestión es que la Maquinilla de Occam puede expresarse de diferentes maneras, la mayoría de las cuales son difíciles de etiquetar como “verdaderas” o “falsas” en un sentido absoluto. Las formas más comunes hablan de probabilidad, no de certezas (que siempre debería ser el caso cuando se habla de generalidades). Mi formulación preferida es “no multiplicar entidades más allá de la necesidad”, (en otras palabras, elija la opción que explique las cosas mientras hace las suposiciones más escasas). Y eso es menos una ley que una instrucción, o un consejo. La implicación es que alguien que sigue esa regla tendrá razón con más frecuencia de lo que estará, pero nadie puede sugerir seriamente que nunca te equivocarás en ese evento.

Este tipo de “maquinilla de afeitar” se trata menos de establecer una ley universal que de eliminar teorías superfluas que es muy poco probable que sean correctas. Funciona simplemente porque, mientras más suposiciones haga, más oportunidades tendrá de equivocarse en una de ellas. Pero uno nunca puede prever todo.

Además de las consideraciones matemáticas, creo que * funciona * porque refleja la realidad, que se vuelve más simple e involucra menos componentes diferentes cuanto más “fundamentales” vayas. Todos los elementos de la tabla periódica se deben a la colocación de los mismos tres componentes más simples: protones, neutrones y electrones. Y los protones y los neutrones están compuestos por diferentes números de dos tipos diferentes de quarks.

Tenemos que asumir que la realidad es así en primer lugar para que haya * explicaciones *: subsumir diversos fenómenos bajo los principios generales o las leyes. La teorización exitosa en ciencia, filosofía y teología (así como en disciplinas menos fundamentales como la economía y la psicología) funcionan esencialmente de esa manera, a pesar de que comprenden diferentes tipos de “puntos de datos” de acuerdo con el tema.

Hay infinitas formas de expresar cada verdad, y la Navaja de Occam es simplemente el axioma de que la más simple es la “correcta”; llegar de Nueva York a California a través de Brasil no es “incorrecto” si aún termina en su destino, pero nunca hay una razón para hacer más con lo que se podría hacer con menos. Es como el concepto de “economía”, que presupone que los deseos son infinitos y que los medios son finitos. La economía es la elección de la asignación, la priorización. De manera similar, responder a una pregunta requiere trabajo, y si el trabajo tiene valor, es inútil desperdiciarlo.

La mente humana es buena en la comparación de patrones. Quizás demasiado bueno. Somos muy buenos para tomar datos y encontrar patrones, explicaciones, teorías. Pero no sabemos cómo apagarlo. Somos susceptibles de ver patrones en datos aleatorios, ya sean pruebas de Rorschach o patrones en nubes, sueños o incluso paranoia y teorías de conspiración.

Compare esto con las técnicas estadísticas y de aprendizaje automático para ajustar datos. En esos escenarios tenemos un problema paralelo: sobre-ajustar los datos. Dados los suficientes grados de libertad, puedo ajustar un modelo a datos aleatorios. Pero cuando hago el modelo tiene poco valor predictivo.

Esa es la razón fundamental de la Maquinilla de Occam: no es una regla demostrable. Pero es una guía útil. Mantenga los modelos lo más simples posible hasta que se demuestre que son inadecuados. O si dos teorías se ajustan por igual a los datos, tome el modelo más simple.

La navaja de afeitar de Occam se usa cuando hay muchos modelos que explican una observación dada. Es muy importante distinguir entre causalidad y correlación en este contexto. Necesitamos un modelo que sea un factor causal para la observación dada en lugar de una mera correlación. Más que una filosofía, la navaja de Occam se basa en la probabilidad. Es muy evidente que hay más número de modelos complejos que explican la observación dada que el número de simples (que son muy pocos). Por lo tanto, un modelo simple es una causa más probable para el evento en lugar de una mera coincidencia (correlación). Pero al final del día aún es probable, y solo estamos asignando la evidencia a una teoría más plausible.

No creo que sea posible decir que la Navaja de Occam sea “verdadera” o “falsa” en el sentido convencional. Diferentes situaciones conllevan diferentes explicaciones o soluciones, y en algunos casos, la más simple puede ser la correcta, y en otros, puede que no lo sea. Además, es imposible definir una explicación como “simple” o “compleja” ya que eso dependería tanto de la persona que explique algo como de la persona a quien se le está dando la explicación.

Cuantas menos suposiciones tenga sobre un fenómeno, cuantas menos variables haya que considerar, más probable es que una pueda llegar a una explicación precisa.

Es como que la distancia más corta entre dos puntos es una línea recta. ¿Por qué tomar un montón de giros y vueltas innecesarios cuando hay un camino más directo?

La razón por la que preferimos la hipótesis más simple que se ajusta a los datos observados es que hay menos hipótesis simples que hipótesis complejas.

Hipótesis suficientemente complejas pueden ajustarse a cualquier dato.

Pueden ajustarse a los datos observados mientras hacen predicciones arbitrarias sobre datos no observados.

Dado que la mayoría de esas predicciones en conflicto serán falsas, la probabilidad de que cualquier hipótesis compleja aleatoria que se ajuste a los datos observados sea válida sería baja.

Como hay tantas hipótesis complejas para elegir, no es sorprendente encontrar una que se ajuste a los datos observados. Se espera que muchos de ellos encajen casualmente.

Pero con relativamente pocas hipótesis simples para elegir, encontrar una que se ajuste a los datos es más sorprendente y le da más razones para sospechar que la adaptación es importante.

Debido a que es un hecho observado, tanto científica como experimentalmente, ¡la naturaleza generalmente prefiere el camino más simple a una solución!

Si, por ejemplo, estuviera descubriendo cuál es el mejor camino para ir de A a B, iría por el más corto, no por innecesario, costoso o difícil.

La navaja de Occam no es verdadera o falsa, es una metodología, una forma de hacer las cosas.
Si dos teorías predicen los resultados igualmente bien, usamos la más simple para predecir los resultados cuando necesitamos resultados predichos, porque en serio, es más simple.

Esto es lo mismo que preguntar si es cierto marinar las costillas durante la noche antes de asarlas.

La navaja de Occam no es tanto una proposición verdadera o falsa como una política o heurística. En igualdad de condiciones, es más fácil trabajar con las explicaciones más simples de las cosas. Pero es perfectamente posible que la explicación más simple resulte equivocada …