¿Qué cursos habría que entender para llegar a la vanguardia del aprendizaje automático?

Para mí, su uso del “sangrado” se relaciona más con los impactos de todo este empuje que con cualquier ventaja. Ahora, ¿por qué es eso? Solo porque se pueda hacer algo, no hay razón para hacerlo. Incluso si los resultados negativos están en el futuro, en algún momento las cosas se recuperan.

Ahora hay mucho poder de computación inactivo con mucha energía humana buscando algún tipo de uso intencional, la situación actual era inevitable. Dado que su interés puede implicar que desea ver esa imagen total y que ya sabe lo básico, salte con los dos pies.

Dónde comenzar no sería ningún punto limitante, incluso si estos pudieran ser recopilados por opinión. Sin conocer su estado académico, sugeriría que solo busque en los temas relacionados con el advenimiento y la evolución de la tecnología computacional en las últimas décadas. Junto con eso, obtén una noción del progreso en el razonamiento matemático y el modelado.

Pero, trate de mirar los campos que tienen alguna conexión con la realidad y la naturaleza. Es decir, todo lo que se recopila del uso de Internet por parte de la gente es más GIGO de lo que se cree (demasiado dinero en el juego distorsiona las mentes).

Lea este documento de 2008. Enfoques de aprendizaje automático para clasificar haplogrupos a partir de los datos de STR del cromosoma Y. Es un ejemplo de trabajo temprano. Sin embargo, es muy claro; también, el dominio es de un tipo que trata temas importantes).

Hago hincapié en retroceder en el tiempo debido a la expansión de la estupidez en todas partes densamente (por lo tanto, uso Silly Valley). Todo ahora tiene algunos antecedentes. Incluso Markov lo admitiría (importancia aquí si está interesado). Además, si reúne suficientes ejemplos de estos tipos, puede dibujar sus propios paralelos (por lo tanto, viene la contribución, no jugar con el código, lo siento, amigos).

De hecho, el sangrado es la población atrapada en el supuesto engaño de un dispositivo inteligente, que se está haciendo brillante por la terminología engañosa. ¿Aprendizaje profundo? El mío proviene del inconsciente y mis intentos de comprender cómo se relaciona con la conciencia que está más allá de cualquier tipo de modelado matemático aplicado, en este momento.

Comprender la mayoría de los algoritmos de aprendizaje automático requiere cierto conocimiento en Probabilidades, Cálculo, Álgebra Lineal y Optimización Convexa. Si desea crear algo nuevo, también debe estar familiarizado con un lenguaje de programación como Python o Matlab para ponerlo en código.

Pero, como dijiste, estas habilidades son útiles solo para comenzar. Creo que los cursos, en cualquier forma, no son suficientes para la investigación. Si desea contribuir al campo, le recomiendo encarecidamente que trabaje con un asesor que pueda evaluar su conocimiento y potencial en diferentes sucursales de ML y tenga muchas ideas para trabajos futuros. Después de uno o dos proyectos, gradualmente estarás listo para la investigación independiente. Iniciar una investigación en un campo sin un supervisor no es una buena idea, en mi humilde opinión.

Sin embargo, si desea tener una idea sobre el estado del arte en ML, puede elegir un tema, por ejemplo, aprendizaje profundo, y leer algunos trabajos recientes en conferencias importantes como ICML, AISTATS e ICLR. Algunos de estos documentos tienen una sección de “trabajos futuros” que pueden darle una pista sobre cómo serán las ideas para futuras investigaciones.

También hay videos disponibles de talleres y escuelas de verano como Deep Learning Summer School y Machine Learning Summer School, algunos de los cuales explican el estado actual de la investigación en ML.

Esta es una pregunta un poco difícil de responder por algunas razones. En primer lugar, no hay un solo borde de sangrado. Hay aprendizaje en línea, aprendizaje profundo, predicción estructurada, aprendizaje automático para datos ordinales, sistemas de aprendizaje automático, etc. Eventualmente, tendrá que especializarse en una de estas áreas y dedicar su tiempo a cosas que no son relevantes para otras.

En segundo lugar, incluso dentro de un área determinada, hay una división entre teóricos y practicantes. Hay una buena cantidad de superposición en los conceptos básicos, pero el énfasis es diferente y, finalmente, las pistas se dividen un poco.

En tercer lugar, literalmente cualquier cosa, desde matemáticas, CS, estadísticas u optimización, podría ser útil, y probablemente podría encontrar temas relevantes de otras disciplinas sin demasiados problemas. El hecho de que no haya aplicaciones de topología diferencial en el aprendizaje automático hoy en día no significa que no habrá en pocos años.

Finalmente, y lo más importante, lo que realmente necesita hacer para impulsar el campo no se encuentra en las clases. Necesitas involucrarte en la investigación, leer artículos, realizar tus propios experimentos o probar tus propios teoremas, y publicar. Ese es un paso necesario para pasar de lo básico a impulsar el campo.

Todo lo dicho, hay un cierto núcleo que creo que todos estarían de acuerdo es necesario, si no es suficiente. En general, esto es probablemente un poco más de lo que se puede hacer en un programa de licenciatura de cuatro años, pero un estudiante diligente podría hacer la mayor parte y compensar el resto de alguna manera.

Primero, necesitarás algunas matemáticas. Los cursos que definitivamente querrás tomar son cálculo multivariable, álgebra lineal, probabilidad y análisis real. El álgebra abstracta, la topología y los procesos estocásticos son potencialmente útiles pero no tan esenciales. Cualquier otra cosa es buena si la encuentras interesante, pero no tan importante.

Segundo, necesitarás algo de informática. La mayoría de las escuelas tienen una secuencia de cuatro semestres de clases introductorias que cubren la programación básica, el diseño de programas, las matemáticas discretas y las estructuras de datos, que son realmente los temas que todos necesitan saber, así que tómelos. La mayoría de los cursos de nivel superior no son tan esenciales, pero el trabajo en bases de datos o sistemas distribuidos puede ser útil si quiere entrar en el lado de los sistemas. Si hay un curso en métodos numéricos que podría ser útil, pero no si está principalmente orientado a resolver ecuaciones diferenciales parciales.

En tercer lugar, deberá tomar al menos un curso de aprendizaje automático. Una clase introductoria estándar cubre vocabulario y algoritmos básicos que todos deben conocer, así como también un poco de la teoría.

En cuarto lugar, hay estadísticas. Debería ver cursos de estadística matemática y análisis de datos, y cualquier otra cosa que se ofrezca como electiva en estadística aplicada. Vale la pena considerar el diseño de experimentos, la teoría del muestreo y cualquier otra cosa relacionada con la recopilación de datos.

En quinto lugar, hay optimización. Deberías tener alguna experiencia con la teoría de la optimización. La optimización convexa es increíblemente útil pero puede ser difícil de enseñar a nivel de pregrado. La programación lineal es un sustituto razonable, ya que muchas de las ideas y la teoría aparecen, pero el nivel de matemática necesario es ligeramente inferior. La optimización discreta es probablemente un poco menos importante, pero la optimización en general es realmente un campo en el que espero ver muchas más coincidencias en el futuro.

Finalmente, puede ver temas de otros campos que podrían ser útiles. Existen aplicaciones en negocios, análisis de redes sociales, lingüística, biología e incluso humanidades, por lo que algunos conocimientos en cualquiera de esos campos podrían ser útiles. Existen técnicas potencialmente útiles en econometría, procesamiento de señales, teoría de control y mecánica estadística, por lo que podría justificar tomar esas clases. La teoría de la información probablemente sea un tema importante, pero no sé si una clase estándar en el departamento de ingeniería eléctrica orientada a los sistemas de telecomunicaciones es realmente tan útil.

Dicho todo esto, realmente quiero destacar la importancia de ir más allá de los cursos para llegar al borde del campo. Una vez que tenga una cierta experiencia, puede comenzar a buscar publicaciones en las principales conferencias y revistas. Algunos de ellos serán opacos, pero muchos serán accesibles, y podrá tener una idea de cuáles son las diferentes áreas de investigación actuales y en qué podría estar interesado. En ese momento, puede comenzar a planificar qué necesitará. Aprender para convertirse en investigador. Es un viaje difícil, pero a veces puede ser divertido.

Justin Rising es perfecto. Él es perfecto en ese curso no es suficiente; no hay un solo borde de sangrado; y las áreas que debes conocer.

Dependiendo de en qué trabajes, los requisitos para estar en la “parte superior” de ML serán diferentes, porque, bueno, ML es un campo enorme. El alcance de ML ya es enorme, y aunque no me gusta lanzar palabras como “ilimitado”, esa es una de las palabras que me vienen a la mente cuando pienso en el alcance potencial de ML.

Si quieres llegar a ser un investigador de alto nivel … ¿puedo sugerirte hacer un montón de cosas, incluyendo clases aleatorias de matemáticas / ciencias / cualquiera que te parezcan interesantes y sigan lo que te gusta y despierte tu interés?

¿Quién sabe? Tal vez la próxima gran novedad en la investigación de ML provendrá de la teoría de categorías (un área de matemáticas puras, para aquellos que no saben) o de la mecánica cuántica. De hecho, mencioné que eran irónicos, pero pensándolo bien, los avances específicos en cualquiera de los dos podrían llevar a grandes avances en el LD. El primero, estoy seguro, podría ayudar en la representación de estados y funciones, mientras que la computación cuántica aceleraría las cosas, si nada más.

Edit: Justin Rising señaló a través de un comentario que ya existen vínculos conocidos entre ML y la teoría de categorías y la física cuántica, algo que en realidad era o al menos debería haber tenido en cuenta. Otra prueba más de que nunca debería escribir una respuesta de Quora cuando estoy cansado …