¿Por qué encuentro el aprendizaje automático tan imposible de aprender?

Usted mencionó que había pasado 2 años tratando de aprender el aprendizaje automático. Para mí, esto muestra que tienes el mínimo de deseo / unidad requerido, pero aún así te resulta imposible. He aquí por qué, y esto puede sorprenderte:

¡Es sobre todo culpa de nosotros, educadores del tema!

Esta es una dura verdad que quizás no conozca: es muy fácil recoger cualquier libro de texto o papel, seguir todas las matemáticas y regurgitarlo de nuevo a la audiencia. Esto es lo que muchos de nosotros hacemos cuando enseñamos conceptos de aprendizaje automático. Si bien lo que se enseña de esta manera es técnicamente correcto, no será necesariamente digerible para quienes aprenden la materia por primera vez.

Dejame darte un ejemplo.

Tome SVMs por ejemplo. Es difícil encontrar libros de texto, MOOC, etc., que presenten SVM sin formularlo en el espacio dual (si sabes lo que es). ¿Es necesario hacerlo? Absolutamente no, pero así es como el creador de los SVM, Vladimir Vapnik, formuló originalmente este problema, y ​​es por eso que generalmente se lo transmiten en su forma original a pesar del hecho de que existen formas equivalentes de resolverlo (en la forma primaria) , que son más fáciles de explicar a alguien que no conoce los SVM.

Otro ejemplo: no se requiere tener ningún conocimiento de probabilidad / estadística para comprender la regresión lineal, la regresión logística, PCA y muchos más modelos de aprendizaje automático. Pero así es como estos temas se enseñan a los aprendices por primera vez, como usted.

¿Cuál es el peligro aquí? Dos cosas:

Primero, hace que los conceptos de aprendizaje automático sean más complejos de lo que deben ser, y como sabemos, los sistemas complejos se rompen con mayor facilidad: si no entiende la dualidad, no entenderá los SVM o si no (aún) cómodo con la teoría de la probabilidad, no tendrá la oportunidad de resolver problemas simples de regresión lineal o logística.

Pero quizás más importante, cuando no aprendes los conceptos de aprendizaje automático en su forma más pura y abstracta, no te das cuenta de las conexiones importantes que existen entre muchos de estos conceptos. Personalmente, he visto que muchos estudiantes que aprenden regresión logística a través de su interpretación probabilística, y los núcleos a través de la formulación dual de SVMs, luchan por conectar las dos ideas y kernelize regresión logística. O muchos estudiantes que tienen dificultades para ver la conexión entre los métodos del núcleo y las redes neuronales, y la lista continúa. Por otro lado, aquellos que aprendan estos conceptos “de la manera correcta” más adelante apreciarán la formulación dual de las SVM y las interpretaciones probabilísticas de los modelos de aprendizaje automático, como la regresión logística.

Entonces, mi consejo para usted es cuando aprenda algo nuevo, no se detenga hasta que encuentre una explicación que tenga sentido para usted. Puede ser difícil de encontrar pero está ahí fuera. Otra forma de expresarlo: no se rinda simplemente porque no pudo seguir la presentación de una idea de una persona. Puede ser culpa de esa persona, no tuya!

Aquí hay una historia sobre el legendario físico y maestro Richard Feynman, narrado por un colega suyo:

“Feynman fue un gran maestro. Se enorgullecía de poder idear formas de explicar incluso las ideas más profundas a los estudiantes principiantes. Una vez, le dije: “Dick, explícame, para que pueda entenderlo, por qué las partículas de medio giro obedecen las estadísticas de Fermi-Dirac”. Feynman, evaluando a la perfección su audiencia a la perfección, dijo: da una conferencia sobre eso. “ Pero él regresó unos días después para decir: ” No pude hacerlo. No pude reducirlo al nivel de primer año. Eso significa que realmente no lo entendemos “.