¿Por qué los humanos aprenden más rápido que las modernas técnicas de aprendizaje profundo?

Creo que una respuesta a esto podría dividirse en tres enfoques separados que pueden estar correlacionados:

  • En primer lugar, es ampliamente conocido que los embriones pueden detectar sonidos en el tercer trimestre, por lo que este sentido ya está avanzado al nacer. Dentro del útero, pueden escuchar voces, canciones o ruido blanco, sin saber la fuente de estos sonidos (es decir, estas muestras no están etiquetadas). Por lo tanto, puede darse cuenta de que los recién nacidos ya tienen un sentido del oído avanzado debido a un entrenamiento previo sin supervisión. En contraste, la vista es el sentido menos desarrollado al nacer y eso se relaciona, en mi opinión, con el hecho de que los bebés no ven dentro del útero. De hecho, la visión no se desarrolla completamente hasta que hayan transcurrido seis meses desde el momento en que nace el bebé.
  • En segundo lugar, creo que usamos un tipo de Base de Conocimientos en nuestro cerebro para razonar sobre lo que hemos aprendido. Por ejemplo, podemos fácilmente dar saltos lógicos incluso si no conocemos las consecuencias de algo. Algunos de nosotros aún no hemos experimentado un accidente automovilístico, pero ciertamente podemos imaginar las consecuencias de esto porque podemos relacionarnos con eventos similares que nos sucedieron. Un accidente automovilístico es mucho más grave que una simple caída, por lo que puede ser más doloroso, y así sucesivamente.
  • Por último, hay muchas indicaciones de que nuestra mente funciona con un solo algoritmo. Hay casos en que las personas dañaron su cerebro tan gravemente que algunas funciones cerebrales fueron reasignadas y emprendidas por otras partes del cerebro. Eso no podría ser cierto si el cerebro utilizara diferentes algoritmos y arquitecturas para, digamos, la visión, el habla y las funciones motoras. Por lo tanto, si pudiéramos encontrar una arquitectura profunda general que se generalice en todas las formas de datos, podríamos llegar a una solución.

Fuentes:

El mundo según los bebés

Phineas Gage: el paciente más famoso de la neurociencia

Escuchando lo que ven los ojos.

Para empezar, hay al menos un pequeño debate en cuanto a la premisa de que el aprendizaje profundo es más lento que el de los humanos, dada la cantidad de ejemplos. Si un niño pequeño interactúa por primera vez con un perro, durante 5 minutos solo se basa en la vista. Asumiendo que los humanos pueden procesar 300 imágenes por segundo. 5 * 60 * 300 = 90000 ejemplos. 90000 parece ser un conjunto de datos suficientemente grande para determinar la diferencia entre un lobo y un perro usando una red neuronal profunda.

La forma en que los humanos interactúan con los objetos es diferente a la de las computadoras. Cuando interactúas con un perro, puedes pasar los dedos por el pelaje y sentir su textura. Si esa es una experiencia nueva, puede ser explorada independientemente.

Los seres humanos también tienen una comprensión más subyacente de los objetos, a través de múltiples sentidos y a través de experiencias pasadas de materiales.

Las redes neuronales recurrentes con memoria a corto y largo plazo buscan resolver algunos de estos problemas. Usando la memoria a largo plazo, las lecciones anteriores se pueden aplicar a los problemas actuales. Sabemos que los cerebros humanos tienen bucles de retroalimentación, similares a los de las redes neuronales recurrentes. Entonces, ¿por cuánto tiempo nuestro cerebro continúa procesando esa información? Con una computadora, finalmente se detendrá y dirá, este es el modelo completo dado el tiempo que me diste. Mientras que un cerebro humano, que dice que estos bucles de realimentación terminan, no hay un punto de parada. Por lo general, cuando se detienen, no hay comienzo de nuevo.

La respuesta obvia es que estas técnicas de aprendizaje profundo no están completas. Si no les importara aprender a la velocidad de un humano, se ejecutaría a la velocidad de una computadora a la potencia de la velocidad de una computadora o un poco menos.

Sin embargo, más detalles, los humanos son simplemente más grandes.
Tenemos una red subyacente más grande que se asigna a diferentes entradas. El equivalente de computadora sería hacer que una computadora escuche (altavoz o mp3), hacer que la computadora vea (cámara o captura de pantalla)
/ video), haciendo que la computadora se sienta (sensores), haciendo que la computadora huela y sepa. Luego, tener la cantidad equivalente de neuronas como base para reconstruir cualquier tipo de sonido, vista, oído, olfato, tacto. Entrénelo durante aproximadamente 3 años, no espere 18 años * también póngalo en la escuela donde puede copiar técnicas avanzadas.

Los humanos ya tienen muchas, muchas redes ya construidas que las técnicas de aprendizaje profundo aún no tienen. Y los usan indistintamente, por eso generalmente son más rápidos.

Contrariamente a la respuesta de Brian Conzman, no estoy de acuerdo con la idea de que sea el volumen y la diversidad de datos lo que nos permite aprender tan rápido. Una red neuronal entrenada en 90,000 imágenes no tiene una comprensión real de lo que está aprendiendo. No tiene un concepto de “objeto” como algo abstracto, es solo un reconocedor de patrón estático. No tiene la capacidad de pensar y contemplar qué es algo. Incluso las redes neuronales recurrentes realmente no pueden hacer esto. Tienen memorias de trabajo muy limitadas. Incluso los RNN LSTM no aprenden tan rápido como los humanos.

Estoy de acuerdo con la respuesta de Nikos en cierta medida, pero no menciona el punto principal, que es el algoritmo de aprendizaje en sí, a diferencia de la arquitectura profunda. La razón por la que los humanos aprenden más rápido debe estar relacionada con el algoritmo de aprendizaje. Hasta ahora, nuestro enfoque básico para el aprendizaje ha sido el descenso de gradiente u otros métodos de optimización. Este no puede ser el algoritmo que utiliza el cerebro, ya que no tiene capacidad para calcular gradientes, devolver gradientes o incluso conocer derivados de las neuronas. Algunos han tratado de argumentar que el cerebro puede hacer esto, pero sus argumentos son realmente muy lejanos. Tenemos que pensar el problema en términos evolutivos. ¿Cómo y por qué se desarrollaría un cerebro con la evolución? La respuesta a esa pregunta nos llevará a la solución (no adivinar arbitrariamente arquitecturas o basarlas en nuestras opiniones de cómo un cerebro “piensa”).