Debes estar refiriéndose a este video:
La inteligencia artificial aprende el nivel de Mario en solo 34 intentos.
El programador explica su proceso a lo largo del video. Le dio a la IA algunas suposiciones básicas. Primero, que la IA puede presionar los botones, y segundo, que el objetivo de la IA es llegar lo más a la derecha posible. A la IA no se le dio ninguna información sobre lo que realmente hizo cada botón.
Mientras se está reproduciendo la IA, evalúa constantemente el tipo y la posición de los objetos en la pantalla. No sabe automáticamente qué cosas lo matarán, pero sí comprende cuándo se detiene su progreso.
La IA juega presionando los botones al azar. Sin embargo, si presionar un botón específico lleva a Mario hacia la derecha, la IA lo recuerda. También recuerda cómo se veía todo en la pantalla cuando presionaba el botón. La próxima vez que las cosas se vean del mismo modo, se realiza la misma acción exitosa. Por ejemplo, podría probar el botón de salto en una situación en la que se está ejecutando hacia adelante y un determinado objeto (uno que resulta ser una koopa) está directamente frente a Mario. Esto evita al enemigo, por lo que la IA recuerda toda la configuración y lo vuelve a hacer la próxima vez.
- Cómo hacer que mi aprendizaje sea más eficiente.
- ¿Qué importancia tiene un profesor en el aprendizaje de una lengua extranjera?
- Cómo memorizar efectivamente las tablas 12 a 30.
- Aprendizaje de idiomas: ¿Por qué algunas palabras son más fáciles de recordar que el resto?
- ¿Puede sugerir un proyecto que pueda ayudarme a aprender el aprendizaje automático? (en R)
Finalmente, la IA tiene una idea bastante clara de qué cosas se deben evitar, cuándo saltar, dónde correr, etc.
En cuanto a qué aprender, puede buscar recursos en redes neuronales. No he estudiado esta técnica en particular, así que lamentablemente no puedo recomendar nada.