¿Cuánto de aprendizaje profundo es ‘inteligencia / aprendizaje real’ y cuánto es solo matemáticas inteligentes?

La respuesta a esta pregunta realmente depende de lo que usted considera “inteligencia / aprendizaje real”. En un nivel alto, en el caso de aprendizaje profundo supervisado, las redes neuronales toman una gran cantidad de datos etiquetados e intentan encontrar una relación dentro de estos datos que minimiza alguna función de pérdida. Cómo se hace esto es donde entran en juego muchas de las matemáticas. Y cuando ve datos futuros, toma decisiones basadas en la relación que aprendió de los datos de entrenamiento.

En un nivel fundamental, hay un argumento de que este es un modelo realmente práctico para la inteligencia, el aprendizaje y la toma de decisiones futuras. Tomemos un ejemplo de una cita del CEO Jeff Bezos sobre su decisión de iniciar Amazon:

El marco que encontré, que hizo la decisión increíblemente fácil, fue lo que llamé, al que solo llamaría un nerd, un ” marco de minimización de arrepentimiento “. Así que quería proyectarme a los 80 años y decir: “Bien, ahora estoy mirando hacia atrás en mi vida. Quiero haber minimizado la cantidad de arrepentimientos que tengo “. Sabía que cuando tenía 80 años no iba a lamentar haber intentado esto. No me iba a arrepentir de intentar participar en esta cosa llamada Internet que pensé que iba a ser realmente un gran problema. Sabía que si fallaba no me arrepentiría de eso, pero sabía que lo único que lamentaría es no haberlo intentado nunca. Sabía que eso me perseguiría todos los días, y cuando lo pensé así, fue una decisión increíblemente fácil.

Esta idea de un marco de minimización de arrepentimiento es algo que la mayoría de las personas puede no articular en términos de tomar sus decisiones diarias, pero en realidad es una que usamos todo el tiempo. Y en ese sentido, el aprendizaje profundo trata de emular la misma idea durante sus fases de entrenamiento y predicción.

Otra técnica en el aprendizaje automático, el aprendizaje por refuerzo, es un modelo aún más directo de ideas en psicología del comportamiento. En un marco de aprendizaje de refuerzo, los agentes en un entorno toman acciones y obtienen alguna recompensa por cada acción. Con el tiempo, el agente comenzará a aprender a tomar acciones que maximicen su posible recompensa. Y cuando los humanos aprenden en las primeras etapas de desarrollo, así es como nuestro sistema de retroalimentación interno procesa el mundo que nos rodea. Por ejemplo, piense en un niño curioso que toca una estufa caliente. Obtiene una respuesta negativa inmediata de la quemadura y es probable que evite esa acción en el futuro. Esto sucede también en contextos de aprendizaje por refuerzo.

Hasta ahora, he argumentado que el aprendizaje profundo es una forma fundamental de la inteligencia y el aprendizaje, pero también hay algunos aspectos del aprendizaje profundo actual que no están al nivel de la inteligencia y el aprendizaje humanos. Los aspectos principales que luchan por competir con los humanos hoy en día son la generalización y la adaptabilidad. Si entrena a un robot para lavar los platos en la casa de una persona con una configuración particular del fregadero, platos y artículos de limpieza, es probable que al robot le resulte difícil descubrir cómo hacer esta tarea en la casa de otra persona con una configuración completamente diferente. de la cocina. Sin embargo, para los seres humanos, la mayoría de nosotros puede tomar las ideas que aprendemos en nuestro entorno familiar y aplicarlas fácilmente a otros entornos sin pensarlo mucho.

Para resumir, si bien hay algunos aspectos del aprendizaje profundo que modelan la inteligencia y el aprendizaje reales, todavía hay una gran cantidad de progreso en las habilidades humanas que aprenden a adaptarse en situaciones y entornos invisibles.