¿Por qué el aprendizaje automático no se utiliza con más frecuencia en las ciencias naturales?

Las ciencias naturales ciertamente han usado, desarrollado y motivado una gran cantidad de técnicas estadísticas, incluidas cosas como los modelos gráficos y las redes bayesianas, que en la actualidad a veces también se considera que están bajo el paraguas del aprendizaje automático.

Pero creo que la pregunta realmente se reduce a la diferencia entre aprendizaje automático y estadísticas. En términos generales, creo que el aprendizaje automático tiene más énfasis en los modelos predictivos , mientras que las estadísticas se centran más en los modelos explicativos o inferenciales . (Consulte: Las dos culturas: ¿estadísticas frente a aprendizaje automático?) Por ejemplo, es posible (de hecho, es muy común) tener un modelo de aprendizaje automático predictivo muy preciso que, sin embargo, no le da ninguna idea de cómo o por qué sucede algo.

Siento que la ciencia natural es, en última instancia, más una cuestión de explicar y comprender los fenómenos en lugar de predecir los fenómenos (aunque los dos no están relacionados), por lo que el aprendizaje automático es menos relevante.

Kevin Lin tiene toda la razón al respecto. Las técnicas de aprendizaje automático son principalmente sobre predicción. La predicción está en el mismo barco que la correlación, útil para predecir el mundo tal como es, pero no el mundo como podría ser . Pero lo que persiguen las ciencias naturales son mecanismos fundamentales de causación. Quieren saber “por qué” sucede algo, y no meramente para predecirlo. La causalidad es mucho más difícil de probar que la correlación, pero también es mucho más útil.

La razón por la cual esta distinción es importante es que, si la configuración del mundo cambia, solo un mecanismo causal fundamental tendrá algún poder. Los modelos puramente predictivos (y no causales) dependen de las relaciones estadísticas en los datos para mantenerse constantes. Pero las relaciones estadísticas no necesitan permanecer constantes, pueden cambiar cuando cambia el mundo. Además, lo que más nos interesa es cambiar el mundo para mejorarlo intencionalmente. También conocido como intervenciones, o ingeniería, o esfuerzos, y una variedad de otros nombres. Debido a que estamos cambiando la configuración del mundo, romperemos cualquier relación estadística existente, pero las relaciones causales fundamentales seguirán siendo ciertas.

Tomemos un ejemplo concreto: la obesidad. Todos sabemos que la obesidad está altamente correlacionada con los malos resultados de salud, como el ataque cardíaco, la hipertensión y la diabetes. En última instancia, a través de estos mecanismos, la obesidad se correlacionará con una menor esperanza de vida. Un modelo predictivo puro, como el que se usa en el aprendizaje automático, predice con precisión la duración de la vida en función de los niveles de obesidad. Si sé lo gordo que eres, puedo adivinar bastante bien cuánto tiempo vas a vivir. Predicción, y nada más. Multa. Pero supongamos que quiero intentar una intervención . Quiero hacer que la gente sea más saludable y que viva más tiempo. ¿Cómo puedo hacer eso? ¡Oh, lo sé! Como la mala salud está relacionada con la obesidad, si elimino la obesidad, ¡eliminaré la mala salud! Aquí está mi plan: dar a todas las personas obesas liposucción cada 2 meses. Pueden comer lo que quieran y no hacer ejercicio, pero mientras esté aspirando la grasa, no habrá problema. Si yo hiciera esto, sería desastroso. Esto se debe a que la obesidad está correlacionada con la mala salud, pero no causa todos estos malos resultados de salud. Si lograra la liposucción exitosa de todos los obesos, lo que encontraría es que la relación estadística entre la obesidad y la mala salud ha desaparecido. Lo alteré con mi intervención, y los rasgos ya no están correlacionados. Pero no he hecho a nadie más saludable, y probablemente haya empeorado a muchas personas (a través de una cirugía constante). Para mejorar los resultados de salud con una intervención, necesitaría un modelo causal, de modo que lo que solucione me lleve a una mejor salud.

Creo que el aprendizaje automático en general no se usa mucho porque muchos modelos educativos se remontan a décadas, sino siglos, mucho antes de que existieran muchas computadoras. Gran parte de la cosecha actual de maestros no está tan versada en computadoras como la gente más joven de hoy. Solo los docentes jóvenes de 20 años podrían ser considerados nativos digitales, y al ser tan jóvenes e inexpertos, probablemente tienen poca influencia en términos de diseño curricular. Una vez que los nativos digitales se entretejen más en la gestión y la administración en los próximos años y décadas, imagino que el aprendizaje automático podría volverse más común.