Yo diría que no ! Me resulta gratificante comparar el aprendizaje por refuerzo con el aprendizaje supervisado y no supervisado, para comprender completamente el problema del aprendizaje por refuerzo. Sin embargo, no creo que el aprendizaje por refuerzo sea una combinación de aprendizaje supervisado y no supervisado.
El aprendizaje por refuerzo es diferente del aprendizaje no supervisado en términos de objetivos . El objetivo del aprendizaje no supervisado es encontrar similitudes y diferencias entre los puntos de datos. Sin embargo, en el problema del aprendizaje de refuerzo, el objetivo es encontrar un buen comportamiento, una acción o una etiqueta para cada situación particular, si así lo desea, para maximizar los beneficios a largo plazo que recibe el agente.
Para comparar el aprendizaje por refuerzo con el aprendizaje supervisado, pensemos en un agente que aprende a jugar ajedrez. En la configuración supervisada, el diseñador debe proporcionar la etiqueta correcta en un subconjunto de situaciones . Imagine lo que es un dolor en el cuello al “dar” la acción correcta al agente en muchas situaciones. De hecho, como jugador humano novato, no puedo proporcionar la mejor acción en muchas situaciones. Sin embargo, en el problema del aprendizaje por refuerzo, solo se espera que el diseñador proporcione una señal de recompensa . En el caso del ajedrez, es realmente trivial: +1 para ganar el juego, -1 para perder el juego y 0 en caso contrario. ¡Entonces sería tarea del agente asignar crédito a las acciones que llevaron al agente a ganar el juego o las acciones que lo arruinaron!
Para concluir, veo el aprendizaje no supervisado como una técnica que aborda un objetivo totalmente diferente y veo el aprendizaje por refuerzo como un problema más general que el aprendizaje supervisado. No hace falta decir que las tres formulaciones de problemas son impresionantes y han sido útiles.
- ¿Cómo puedo aprender más sobre el espíritu empresarial en la Universidad de Columbia?
- ¿Dónde puedo aprender boxeo profesional en un mes?
- ¿Cuál es el mejor lugar para aprender PNL?
- ¿Cuál es la mejor manera de mejorar el inglés hablado que no sea practicar?
- ¿Cuáles son las maneras de tener éxito en el aprendizaje si no puedo memorizar lo que leo?