¿Cuáles son algunos consejos para alguien que quiere aprender Aprendizaje automático?

El aprendizaje automático es un poder energizante y disruptivo en el mundo de la tecnología, y los propietarios de pequeñas empresas querrán ser claros sobre las promesas, los resultados e incluso los riesgos de esta tecnología emergente. ¿Qué tal si paseamos por las 30 cosas más imperativas que todos deberían saber sobre el aprendizaje automático en este momento?

  1. El aprendizaje automático consiste en datos y algoritmos, pero en su mayor parte datos. Existe una considerable medida de fervor sobre los avances en los algoritmos de aprendizaje automático, y especialmente sobre el aprendizaje profundo. En cualquier caso, los datos son el ingrediente clave que hace que el aprendizaje automático sea concebible. Puede tener aprendizaje automático sin algoritmos modernos, pero no sin grandes datos.
  2. A menos que tenga muchos datos, debe atenerse a los modelos básicos. El aprendizaje automático entrena un modelo a partir de patrones en sus datos, investigando un espacio de modelos concebibles definidos por parámetros. En el caso de que su espacio de parámetros sea demasiado grande, se adaptará a sus datos de entrenamiento y capacitará a un modelo que no se generalice más allá. Una aclaración punto por punto requiere más cálculos, sin embargo, cuando tenga dudas, debe mantener sus modelos. Tan básico como podría ser permitido.
  3. El aprendizaje automático solo puede ser tan bueno como los datos que usas para entrenarlo. La frase basura en, basura fuera ” es anterior al aprendizaje automático, sin embargo, de manera relevante caracteriza una restricción clave del aprendizaje automático. El aprendizaje automático solo puede encontrar patrones que estén presentes en sus datos de entrenamiento. Para tareas de aprendizaje automático supervisadas , como la clasificación , necesitará una colección vigorosa de datos de capacitación con etiquetas completas y correctamente etiquetados.
  4. El aprendizaje automático solo funciona si sus datos de entrenamiento son representativos. Al igual que un prospecto de fondo advierte que “el rendimiento pasado no es garantía de resultados futuros”, el aprendizaje automático debe advertir que solo se garantiza que funcione para los datos generados por la misma distribución que generó sus datos de capacitación. Tenga cuidado con los sesgos entre los datos de entrenamiento y los datos de producción, y vuelva a entrenar sus modelos con frecuencia para que no terminen completamente obsoletos.
  5. La gran mayoría del trabajo duro para el aprendizaje automático es la transformación de datos. Al examinar la acumulación de nuevos procedimientos de aprendizaje automático, puede imaginar que el aprendizaje automático consiste principalmente en seleccionar y ajustar algoritmos. En realidad, es más común: la mayor parte de su tiempo y esfuerzo se destina a la limpieza de datos. y la ingeniería de características – Es decir, cambiando las características en bruto. en características que mejor representan la señal en sus datos.
  6. El aprendizaje profundo es un avance revolucionario, pero no es una bala mágica. El aprendizaje profundo se ha ganado su entusiasmo por transmitir avances a través de un amplio espectro de zonas de aplicación de aprendizaje automático. Además, el aprendizaje profundo automatiza parte del trabajo que tradicionalmente se realiza a través de la ingeniería de características, especialmente para datos de imagen y video. Pero el aprendizaje profundo no es un proyectil de plata. No puede simplemente utilizarlo fuera del contenedor, independientemente de lo que tenga que hacer un gran esfuerzo en la purificación de datos y el cambio.
  7. Los sistemas de aprendizaje automático son altamente vulnerables al error del operador. Reflejando a la NRA, “ los algoritmos de aprendizaje automático no matan a las personas; las personas matan a las personas ”. Cuando los sistemas de aprendizaje automático fallan, rara vez se debe a problemas con el algoritmo de aprendizaje automático. Lo más probable es que hayas introducido errores humanos en los datos de entrenamiento, creando sesgos o algún otro error sistemático. Siempre sea escéptico y acérquese al aprendizaje automático con el tren que aplica a la ingeniería de software.
  8. El aprendizaje automático puede hacer inadvertidamente una profecía inevitable. En numerosas aplicaciones de aprendizaje automático, las elecciones que realice hoy influyen en los datos de capacitación que recopilamos mañana. Una vez que su sistema de aprendizaje automático inserta sesgos en su modelo, puede continuar generando nuevos datos de entrenamiento que fortalecen esos sesgos. Y unos cuantos prejuicios pueden demoler las vidas de las personas. Ten cuidado : no hagas resultados inevitables.
  9. La IA no se volverá consciente de sí misma, se levantará y aplastará a la humanidad. Un número asombroso de personas parece tener sus pensamientos con respecto a la inteligencia artificial de las películas de ciencia ficción. Deberíamos estar motivados por la ciencia ficción, pero no tan crédulos como para mezclarlos con la realidad. Hay suficientes riesgos reales y presentes para estresarse, desde individuos deliberadamente detestables hasta, sin saberlo, modelos de aprendizaje automático de un solo lado. Así que puedes dejar de preocuparte por SkyNet y la “superinteligencia”.
  10. Aprendizaje automático significa aprender de los datos; AI es una palabra de moda. El aprendizaje automático satisface la acumulación: hay una gran cantidad de problemas que puede abordar al proporcionar la información de preparación correcta a los cálculos de aprendizaje correctos. Llámelo AI si eso lo alienta a ofrecerlo, pero comprenda que, en cualquier caso, tal como se utiliza fuera del mundo académico, con frecuencia es una expresión de moda que puede significar lo que los individuos necesitan que signifique.
  11. APRENDIZAJE = REPRESENTACIÓN + EVALUACIÓN + OPTIMIZACIÓN Supongamos que tiene una aplicación para la que cree que puede ser útil el aprendizaje automático. El principal problema al que te enfrentas es la asombrosa variedad de algos de aprendizaje accesibles. ¿Cuál utilizar? Hay verdaderamente miles de accesos, lo que es más, cientos más se distribuyen cada año. La forma de no mezclarse en este espacio gigantesco es comprender que se compone de mezclas de solo tres segmentos.
  12. Lo que importa es la generalización: el objetivo principal del aprendizaje automático es resumir los casos del conjunto de preparación. Esto se debe a que, independientemente de la cantidad de información que tengamos, es poco probable que veamos esas ilustraciones correctas nuevamente en el momento de la prueba. La combinación más reconocida entre los novatos de aprendizaje automático es probar la información de preparación y tener el engaño del progreso. En el caso de que el clasificador seleccionado se pruebe con nueva información, generalmente no es superior a cualquier especulación irregular. De esta manera, en caso de que contrates a alguien para que construya un clasificador, asegúrate de guardar parte de la información para ti mismo y probar el clasificador que te dan.
  13. SOLO DATOS NO ES SUFICIENTE La generalización siendo el objetivo tiene otro resultado real: los datos por sí solos no son suficientes, independientemente de la cantidad que tenga.
  14. EL ALOJAMIENTO SUPERIOR TIENE MUCHAS CONDICIONES: todos en el aprendizaje automático piensan en el sobreajuste, sin embargo, se presentan en muchas estructuras que no son evidentes rápidamente. Un enfoque para comprender el sobreajuste es el deterioro del error de generalización en sesgo y varianza .
  15. LA INTUICIÓN FALLA EN MEDIDAS ALTAS: Posteriormente al sobreacuerdo, el problema más serio en el aprendizaje automático es el flagelo de la dimensionalidad. Numerosos algoritmos que funcionan bien en mediciones bajas terminan claramente imposibles de manejar en el momento en que la información es de alta dimensión. Sea como sea, en el aprendizaje automático se alude a mucho más. En resumen, los movimientos con precisión se vuelven exponencialmente más difíciles a medida que se desarrolla la dimensionalidad (número de características) de los casos, sobre la base de que un conjunto de preparación de tamaño establecido cubre una división de disminución del espacio de información.
  16. LAS GARANTÍAS TEÓRICAS NO SON LO QUE APARECEN: los documentos de aprendizaje automático están cargados de certificaciones hipotéticas. El tipo más conocido es un límite en la cantidad de ex-amplas que se espera que garanticen una gran especulación. ¿Qué debes hacer con estas certificaciones? La parte principal de las certificaciones hipotéticas en el aprendizaje automático no es la base para las elecciones prácticas, sino como una fuente de comprensión y un impulso principal para el plan de algoritmos.
  17. LA INGENIERÍA DE CARACTERÍSTICAS ES LA CLAVE: Hacia el final del día, algunos proyectos de aprendizaje automático tienen éxito y otros se quedan cortos. ¿Qué tiene el efecto? Efectivamente, el factor más vital es lo más destacado utilizado. En el caso de que tengas muchos puntos destacados que cada uno corresponda bien con la clase, el aprendizaje es simple. Por otra parte, si la clase es una capacidad excepcionalmente compleja de los aspectos destacados, es posible que no esté listo para aprenderla. Con frecuencia, los datos en bruto no están en una forma que sea agradable de adaptar, sin embargo, puede desarrollar aspectos destacados a partir de ellos. Esto es comúnmente donde va la gran mayoría del esfuerzo en una empresa de aprendizaje automático. Con frecuencia, también es un destacado entre las partes más fascinantes, donde el instinto, la inventiva y la “artesanía oscura” son tan imprescindibles como el material especializado.
  18. MÁS DATOS COMPRENDEN A UN ALGORITMO QUE SEA UN CLAVE: suponga que ha creado la mejor disposición de características que puede, sin embargo, los clasificadores que está obteniendo aún no son lo suficientemente exactos. ¿Qué serías capaz de hacer ahora? Hay dos decisiones principales: planificar un algoritmo de aprendizaje superior o reunir más datos . Los científicos del aprendizaje automático están esencialmente preocupados por lo anterior, pero incluso la manera más rápida de progresar es frecuentemente obtener más datos.
  19. APRENDE MUCHOS MODELOS, NO SIMPLEMENTE UNO: Al comienzo del aprendizaje automático, la mayor parte del esfuerzo consistió en intentar numerosas variaciones y elegir el mejor. En ese punto, los exámenes empíricos precisos demostraron que el mejor alumno difiere de una aplicación a otra, y comenzaron a aparecer los marcos que contenían numerosos alumnos diferentes. El esfuerzo ahora consistía en intentar numerosas variedades de numerosos estudiantes y, hasta el momento, elegir la mejor.
  20. LA SIMPLICIDAD NO INFIERE A LA EXACTITUD: en el aprendizaje automático, dados dos clasificadores con el mismo error de preparación, el menos complejo de los dos probablemente tendrá el error de prueba más mínimo. Las confirmaciones indicadas de esta reclamación aparecen regularmente en la escritura, sin embargo, en la actualidad hay algunos casos contrarios a la misma, y ​​las hipótesis de “no comer gratis” sugieren que no puede ser válida.
  21. REPRESENTABLE NO SUGIERE APRENDER Básicamente, todas las representaciones utilizadas en los aprendices de tamaño variable tienen teoremas asociados de la forma “Se puede hablar de cada función, o se puede aproximar de forma discrecional casi, utilizando este retrato”. todos los otros. Sea como sea, el hecho de que se pueda hablar de una capacidad no significa que pueda ser académico.
  22. LA CONEXIÓN NO IMPLICA LA CAUSACIÓN El objetivo de aprender modelos predictivos es utilizarlos como asesores para la acción. En la remota posibilidad de que encontremos que las bebidas y los bocadillos a menudo se compran juntos en la tienda de comestibles, en ese momento, tal vez poner una bebida junto a la sección de bocadillos incrementará las ofertas. Sin embargo, tímido de hacer el examen es difícil de decir. El aprendizaje automático se aplica generalmente a los datos de observación , donde las variables predictivas no están bajo el control del aprendiz, a diferencia de los datos experimentales , donde están.
  23. Los algoritmos deben ser implementados antes de ser utilizados.
  24. El aprendizaje automático es un subconjunto de la IA El aprendizaje automático es una forma práctica de inteligencia artificial, y habla de la ciencia de lograr que las computadoras se inspiren sin ser programadas explícitamente.
  25. El aprendizaje automático está a nuestro alrededor. Vemos casos cotidianos de aprendizajes automáticos que nos rodean y, por supuesto, subestimamos a menudo: el etiquetado en Facebook, las recomendaciones de productos de Amazon, el sistema de clasificación de páginas de Google o el filtrado automático de spam en Gmail están en el Casos enteros de aprendizaje automático.
  26. El aprendizaje automático habla con otra cosmovisión en computación En un artículo reciente sobre el tema, Pedro Domingos lo dice de esta manera: “Los algoritmos de aprendizaje automático pueden descubrir cómo realizar tareas importantes al generalizar a partir de ejemplos. Esto es a menudo factible y rentable donde la programación manual no lo es. A medida que se disponga de más datos, se pueden abordar problemas más ambiciosos. Como resultado, el aprendizaje automático es ampliamente utilizado en informática y otros campos “.
  27. El aprendizaje automático es el centro de la tecnología de “máquinas inteligentes” : las máquinas inteligentes son sistemas que utilizan inteligencia artificial y algoritmos de aprendizaje automático para tomar decisiones y abordar problemas sin intercesión humana. Las máquinas inteligentes se encuentran en las aplicaciones que lo acompañan: dispositivos sensibles al contexto, como teléfonos celulares que detectan su condición física y ajustan su comportamiento en consecuencia; asistentes personales inteligentes como Google Now, Apple Siri;
  28. El aprendizaje automático perturbará significativamente el destino final de los trabajos : la investigación muestra que numerosos CEOs están subestimando el efecto sistémico y profundo que las máquinas inteligentes tendrán hasta 2020, así como el potencial para que puedan reemplazar millones de empleos de clase media en las décadas a ven.
  29. El aprendizaje automático creará nuevas oportunidades de aprendizaje : los expertos en TI y negocios deben mantener sus capacidades de empleo pertinentes y actualizadas garantizando que buscan capacidades y diligencias psicológicas que las máquinas no pueden tocar. Esto requerirá progresar en la preparación y mejora de las aptitudes de solicitud más altas, por ejemplo, codificación, estadísticas, visualización, lingüística, gestión de la información y Big Data.
  30. Sólo se puede aprender el aprendizaje automático mediante la implementación de algoritmos.

El mejor consejo final: cómo aprender el aprendizaje automático en 90 días

El aprendizaje automático es una aplicación de inteligencia artificial (IA) que proporciona a los sistemas la capacidad de aprender y mejorar automáticamente a partir de la experiencia sin ser programado explícitamente. El aprendizaje automático se centra en el desarrollo de programas informáticos que pueden acceder a los datos y utilizarlos, aprender por sí mismos.

El proceso de aprendizaje comienza con observaciones o datos, como ejemplos, experiencia directa o instrucción, para buscar patrones en los datos y tomar mejores decisiones en el futuro en función de los ejemplos que brindamos. El objetivo principal es permitir que las computadoras aprendan automáticamente sin intervención o asistencia humana y ajustar las acciones en consecuencia.

A continuación se presentan los 12 consejos útiles.

1. APRENDIZAJE = REPRESENTACIÓN + EVALUACIÓN + OPTIMIZACIÓN

2. Es la generalización que cuenta

3. Los datos solos no son suficientes

4. El exceso de equipamiento tiene muchas caras

5. LA INTUICIÓN FALLA EN ALTAS DIMENSIONES

6. LAS GARANTÍAS TEÓRICAS NO SON LO QUE PARECEN

7. LA INGENIERÍA DE CARACTERÍSTICAS ES LA CLAVE

8. MÁS DATOS LLEGAN A UN ALGORITMO MÁS LIMPIO

9. APRENDE MUCHOS MODELOS, NO SOLO UNO

10. LA SIMPLICIDAD NO IMPLICA LA PRECISIÓN

11. REPRESENTABLE NO IMPLICA APRENDER

12. LA CORRELACIÓN NO IMPLICA LA CAUSACIÓN

También puede ir a través de algunos cursos en línea de aprendizaje automático:

Puedo sugerirte los cursos en línea de aprendizaje automático:

· Machine Learning AZ ™: práctica en Python & R en Data Science

Y aquí está el mejor y ampliamente utilizado curso en línea:

De esto puedes saber sobre:

Este curso es divertido y emocionante, pero al mismo tiempo se adentra en el Aprendizaje automático. Se estructura de la siguiente manera:

· Parte 1 – Preprocesamiento de datos

· Parte 2 – Regresión: regresión lineal simple, regresión lineal múltiple, regresión polinomial, RVS, regresión de árbol de decisión, regresión aleatoria de bosques

· Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación de árboles de decisión, Clasificación de bosques aleatorios

· Parte 4 – Agrupación en clúster: K-medias, agrupación jerárquica

· Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat

· Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson

· Parte 7 – Procesamiento de lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL

· Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales

· Parte 9 – Reducción de la dimensionalidad: PCA, LDA, Kernel PCA

· Parte 10 – Selección de modelo y realce: validación cruzada de k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está lleno de ejercicios prácticos que se basan en ejemplos en vivo. Así que no solo aprenderá la teoría, sino que también obtendrá práctica práctica en la construcción de sus propios modelos.

Y como beneficio adicional, este curso incluye plantillas de código R y Python que puede descargar y usar en sus propios proyectos.

Algunos cursos más en línea de aprendizaje automático:

· Ciencia de datos y Bootcamp de aprendizaje automático con R

· Aprendizaje automático para la ciencia de datos

Libros de texto sugeridos para aprendizaje automático: (sólo con fines de referencia)

· Aprendizaje automático con Scikit-Learn y TensorFlow: conceptos, herramientas y técnicas para construir sistemas inteligentes por Aurélien Géron

· Aprendizaje automático para principiantes absolutos: una introducción en inglés sencillo por Oliver Theobald

TODO LO MEJOR…………….

Si bien estoy de acuerdo con Debanjan Sengupta en que la programación es una parte importante que no debe perderse, primero debe descubrir su debilidad.

¿Es matemática, programación o algoritmos?

Para averiguarlo, solo profundice. Comience con un caso de uso con el que pueda relacionarse. Trate de encontrar métodos que se están utilizando para resolver el caso de uso. Busque el código en github, preguntas sobre desbordamiento de pila. Una ronda de esto y luego sabrías qué es lo que más te faltaba. Haz una lista y comienza a aprender los conceptos. Sigue resolviendo los problemas reales del lado.

No se limite a seguir leyendo o viendo videos. Mantenga las cosas interesantes trabajando en problemas reales en el lateral. Cuando te sientas menos desafiado, elige un artículo de investigación conocido y trata de darle sentido. No te desanimes si no consigues mucho. Úselo como un bucle de retroalimentación para aprender conceptos (como backprop

De nuevo enfócate en los problemas o el dominio con el que te puedes relacionar ML no es realmente CS y matemáticas. Se observa que aquellos con mejor conocimiento del dominio (adquirido o poseído) se desempeñan mejor en los concursos de Kaggle.

¡Todo lo mejor!

Ser fuerte en matemáticas, algoritmos, DS y programación.

Aprenda los siguientes temas antes de sumergirse en el aprendizaje automático:

  • Álgebra lineal (espacios vectoriales, sistemas lineales, descomposición de matrices, etc.,)
  • Cálculo (derivadas parciales, gradientes de función, etc.,)
  • Probabilidades y estadísticas
  • Sea competente en un lenguaje de programación de su elección (le sugiero que considere Python o R)

Si sabe algo de la programación de Python, consulte el curso de introducción a continuación sobre estadísticas y probabilidad: Estadísticas y probabilidad en Data Science utilizando Python

Toma estos cursos gratuitos de edX para obtener una educación real:

  1. Aprendizaje automático para la ciencia de datos: aprenderá una variedad de algoritmos de aprendizaje supervisados ​​y no supervisados, y la teoría detrás de esos algoritmos.
  2. Inteligencia Artificial (AI): “Aquí viene el rey del poder, y yo lo llamo AI: D” . Puedes aprender Introducción a la IA, Historia de la IA, Construir agentes inteligentes (búsqueda, juegos, etc.,), algoritmos de aprendizaje automático. Aplicaciones de la IA (Procesamiento del Lenguaje Natural, Robótica / Visión)
  3. Aprendizaje automático: verás algunos temas repetitivos que has visto en los dos cursos anteriores. Si no estás aburrido, trata de verlos de nuevo.

Trate de hacer algunos proyectos en tiempo real. Participa en las competiciones de Kaggle.

¡Espero que esto ayude!

¡Feliz aprendizaje!

Consejos simples:

  1. ¡Cree un registro de los experimentos que está realizando, sin importar qué trivial pueda parecer! Eso le ayuda a comprender y contemplar sus ideas de manera integral.
  2. Comprenda los datos que está utilizando para capacitar a la red. Es como tu trabajo de curso e intentas entender el trabajo de curso antes de aventurarte en un tema en particular. ¿No es así?
  3. Mantenga una actualización sobre el estado del arte del trabajo de investigación (ya sea visión, PNL o lo que sea).
  4. Intente comprender las matemáticas y las intuiciones detrás de un algoritmo en particular.
  5. Intenta implementar cosas.
  6. Intente resumir los experimentos por su cuenta, interpretando los resultados que ha obtenido. Trabajar en grupo ayuda.

    Eso es sobre todo lo que sigo! Si siente algo o necesita ayuda con un tema en particular, no dude en enviarme un correo electrónico

    ¡Todo lo mejor!

    ¡Aclamaciones!

APRENDE A PROGRAMAR !!!

Esto es lo primero y lo más importante hasta que, a menos que esté trabajando en Teoría del aprendizaje satístico, que es un juego completamente diferente y difícil.

Lo aprendí de la manera difícil. Nadie me dio este consejo cuando estaba empezando.

El aprendizaje automático es más que solo comprender cómo funciona un algoritmo y las matemáticas detrás de él. No me malinterpretes. La matemática es importante.

Pero a menos que tome un conjunto de datos real y aplique algún algoritmo en él para alguna tarea específica, nunca sabrá acerca de todos los detalles de la practicidad de construir un modelo funcional. Te darás cuenta de que muchos de esos aspectos prácticos no se mencionaron en tus lecciones de teoría.

El aprendizaje automático es tanto CS como matemático como intuición.

A menos que pueda administrar todos estos tres en paralelo, solo podrá usar ML como una caja negra (es diferente de una caja de herramientas).

A2A. ¿Desde donde puedo aprender la inteligencia artificial y el aprendizaje automático considerando el futuro de la automatización?

  • Aprender estadísticas y aplicarlas a los datos.
  • Simplemente no intente aplicar los paquetes / algos en los datos, pero estudie por qué se usó ese algoritmo y cuáles son los pros y los contras y cómo se aplica a los datos.
  • Lea los supuestos de los algoritmos y por qué también

Únase a nuestro Disrupt 4.0: AI: Taller intensivo de un día en Machine Learning: Disrupt 4.0: Inteligencia artificial: Taller intensivo de un día en Machine Learning Tickets, Gurugram | Explara.com

Te dará un buen comienzo en tu viaje de aprendizaje de ML.