¿Cómo aprender sobre el aprendizaje de máquina por mi cuenta?

He luchado con una pregunta así durante bastante tiempo. Por eso hice un breve video de YouTube para delinear las 6 áreas clave que son útiles para cualquier persona que quiera aprender sobre Aprendizaje automático:

https://www.youtube.com/watch?v=….

El aprendizaje automático es un tema extremadamente vasto y puede ser muy intimidante para un principiante completo comenzar a aprender sobre este campo súper interesante. ¡Ciertamente fue para mí! Por eso esbozaré 6 áreas principales que me parecieron muy útiles al aprender sobre diferentes aspectos del aprendizaje automático.

1. Python

Python no es necesario para aprender la mayoría de los conceptos de aprendizaje automático. Repito, Python no es necesario para aprender sobre el aprendizaje automático. De hecho, puede aprender muchos conceptos de aprendizaje automático sin saber una sola línea de código. Entonces, ¿por qué lo preguntas, lo he incluido en mi lista?

Esto se debe a que Python viene con una gran cantidad de bibliotecas incorporadas, la mayoría de las cuales son para aprendizaje automático, como Scikit-Learn, Numpy y Pandas.

También hay muchos libros sobre ML y AI con ejemplos escritos en Python, así como muchos cursos en línea que también promueven Python. Estas son algunas de las razones por las que recomiendo aprender Python como uno de los lugares para comenzar cuando se trata de Machine Learning.

Las dos fuentes que recomiendo para aprender Python son Python Crash Course y los documentos oficiales. He hablado de este libro en otro video, y junto con la documentación oficial debería ser suficiente para comenzar realmente con Python.

Python Crash Course: https://www.amazon.com/Python-Crash-C…
Documentos oficiales: https://docs.python.org/3/

2. libros
El siguiente en mi lista son algunos buenos libros sobre Aprendizaje Automático. Los libros son una excelente fuente de aprendizaje y recomiendo mis 3 libros favoritos de ML, que son Aprendizaje práctico con SciKit y TensorFlow , Aprendizaje profundo con Python y Make Your Own Neural Network . Estos cubren una gran cantidad de temas y son adecuados para principiantes.

Hands On ML con Scikit-Learn & TF cubre los aspectos básicos de ML en la primera parte del libro que incluye capítulos sobre clasificación, Máquinas de vectores de soporte, Reducción de dimensiones, Árboles de decisión y bosques aleatorios. Esto realmente proporciona una excelente visión general para el campo de ML. La segunda parte del libro se centra en NN y DL con TensorFlow. Cubre NN artificial, NN recurrentes convolucionales, aprendizaje de refuerzo de codificador automático y mucho más. Muy recomendable.

http://shop.oreilly.com/product/06369…

El aprendizaje profundo con Python está escrito por Francois Chollet, que es el autor oficial de Keras, que es un API de NN de alto nivel escrito en Python. Capaz de correr en TF. Cubre los fundamentos de DL, matemáticas de NN, fundamentos de ML, DL para visión por computadora, DL para texto y secuencias y DL avanzado entre muchos otros capítulos interesantes.

https://www.manning.com/books/deep-le…

El tercer libro que recomiendo altamente es Make your Own NN de Taqriq Rashid. El título de este libro es bastante autoexplicativo. Proporciona una guía paso a paso a través de las matemáticas de NN mientras diseñas tu propia NN en Python. Es adecuado para principiantes y es altamente revisado en muchas plataformas. ¡Te recomiendo que mires este libro!

https://www.amazon.com/Make-Your-Own-…

3. Matemáticas

Las matemáticas son esenciales en el aprendizaje automático y es mejor repasar / aprender sobre algunos temas clave. Estos incluyen álgebra lineal, probabilidad, estadística y cálculo multivariable. Simplemente buscar estos términos en google te llevará a un excelente material.

Si estos temas no se tratan aquí, seguramente los volverá a encontrar en algunos de los libros que recomiendo y en muchas de las fuentes en línea. Por lo tanto, vale la pena cubrirlos de antemano para que no se quede atascado mientras lee otro material más adelante, lo que dificulta la comprensión de lo que está sucediendo.

He resaltado las siguientes tres fuentes.

https://www.quantstart.com/artic…

https://www.quantstart.com/artic…

http://wiki.fast.ai/index.php/Ca…

4. Blogs / Fuentes en línea
Hay muchas fuentes en línea excelentes que realmente extraen la información más importante sobre muchos temas diferentes de aprendizaje automático. Estos son increíblemente interesantes y no solo explican el tema de manera muy clara, sino que también utilizan excelentes representaciones visuales para que sea más fácil de entender.

Dos fuentes excelentes en particular son el blog y las redes neuronales de Colah y el aprendizaje profundo de Michael Nielson. También he incluido un cuadro completo de redes neuronales que puede servir como una hoja de trucos.

Inicio – blog de colah
http: // neuralnetworksanddeeplear …
https://towardsdatascience.com/t…

El Blog de Colah es uno de los recursos principales que hay para obtener una visión intuitiva de algunos de los temas más interesantes de Machine Learning. Colah escribe de manera excelente sobre las redes neuronales y su topología, las redes neuronales recurrentes, las redes neuronales convolucionales y las redes neuronales de visualización, entre muchos otros temas super interesantes. Él realmente combina visuales sobresalientes para que podamos comprender mejor.

El libro en línea de Michael Nielson también es ampliamente considerado como uno de los mejores recursos para aprender sobre el aprendizaje automático en la web. Continúa cubriendo muchos temas en un enfoque sistemático que es altamente efectivo en este campo de estudio. Algunos de los temas no tienen ningún impacto en las matemáticas, por lo que en ciertos capítulos se asume cierto conocimiento previo sobre el cálculo de múltiples variables.

También me he vinculado a un cuadro completo de redes neuronales que puede servir como una guía de referencia rápida.

5. TensorFlow

TensorFlow también proporciona un excelente material para aprender sobre el aprendizaje automático. Para aquellos que no lo saben, TF es un marco de aprendizaje de código abierto de máquina.

Tutoriales | TensorFlow

TensorFlow nos proporciona un tutorial de inicio en el que pasamos de la creación de nuestra primera red neuronal a la creación de optimizadores. Luego pasamos a la Guía del programador donde podemos aprender sobre las API de bajo nivel, cómo visualizar gráficos y usar el tablero tensor.

Una guía para las capas de FT: Construyendo una red neuronal convolucional | TensorFlow

TensorFlow también tiene algunos excelentes tutoriales sobre reconocimiento de imágenes, representación de datos y manejo de datos de secuencia. Por ejemplo, el tutorial de MNIST nos presenta las CNN y cómo construir una CNN y entrenarla en el conjunto de datos de MNIST para reconocer dígitos escritos a mano.

Reconocimiento de imágenes | TensorFlow

El siguiente tutorial también trata sobre el reconocimiento de imágenes, donde se nos proporciona un C ++ y una API de Python para entrenar nuestras redes neuronales. TF también tiene un tutorial completo en CNN donde pasamos por el proceso de entrenamiento de nuestra CNN y vemos la tasa de aprendizaje de nuestro modelo.

Redes neuronales convolucionales | TensorFlow

6. Otros
Hay algunos cursos en línea excelentes proporcionados por Coursera, Udemy, Udacity y otros, así que no dude en consultarlos.
También hay muchos canales de YouTube excelentes en los que puedes encontrar tutoriales sobre prácticamente cualquier cosa que desees. Echa un vistazo a 3Blue1Brown, por ejemplo.
Por último, si se atasca en un problema particular, es probable que alguien haya tenido el mismo problema antes que usted. Es posible que desee consultar la comunidad de Stack Exchange , que se extiende desde el sitio web de preguntas y respuestas de Overflow de Stack que la mayoría de ustedes ha escuchado.

El aprendizaje automático es un campo verdaderamente vasto y en rápido desarrollo. Será abrumador sólo para comenzar. Sin duda, ha estado saltando en el punto en el que necesita usar la máquina para averiguar cómo construir modelos. Piensa un poco en lo que debe hacer; sin embargo, cuando se filtra la web en busca de algoritmos concebibles, hay muy recientemente un número excesivo de alternativas.

Para aprender el aprendizaje automático, debes ser mejor que el promedio en matemáticas. Aquí están las matemáticas que debe aprender teniendo en cuenta el objetivo final para estar preparado.

  • Álgebra lineal-Álgebra lineal – MIT 18.06 Álgebra lineal por Gilbert Strang
  • Teoría de probabilidad-Probabilidad y estadística – MIT 6.041 Análisis probabilístico de sistemas y probabilidad aplicada por John Tsitsiklis
  • Cálculo
  • Cálculo multivariado
  • Teoría de grafos
  • Métodos de optimización
  • Cualquier lenguaje de programación que sea ampliamente utilizado para ML como python, MATLAB o C ++.

PD: recomendaría Python aquí como idioma y recomendaría los siguientes enlaces:

  • Aprendizaje automático con texto en scikit-learn (PyCon 2016)
  • Aprendizaje automático en Python con scikit-learn
  • Aprendizaje automático con Python

Una vez cumplidos estos requisitos, por fin puede comenzar a considerar el Aprendizaje automático.

6 PASOS FÁCILES PARA UTILIZAR EL APRENDIZAJE EN MÁQUINA?

Este es el lugar donde comienza la diversión. Ahora, se espera que la fundación comience a echar un vistazo a algunos datos. Antes de comenzar, he enumerado 30 cosas que todos deberían saber en Aprendizaje automático . La mayoría de las empresas de aprendizaje automático tienen básicamente el mismo proceso de trabajo:

PASO 1.) Fabrique sus fundamentos de aprendizaje automático estudiando algunos materiales relacionados con el tema:

a.) Las conferencias de Aprendizaje automático de Andrew Ng son un gran comienzo :

b.) Escuela de verano de aprendizaje automático :

c.) Un enlace a la lista de reproducción completa está aquí (Colección de conferencias | Aprendizaje automático)

https://www.youtube.com/view_pla

d.) Certificado de aplicaciones y minería de datos de Stanford :

http://scpd.stanford.edu/public/…

e.) Introducción a la inteligencia artificial por el Prof. Deepak Khemani IIT Madras

http://nptel.ac.in/courses/10610

f.) “La mejor introducción de aprendizaje automático que he visto hasta ahora”.

PASO 2.) Toma un curso en línea

Lo principal que aconsejo a alguien que necesita aprender aprendizaje automático es tomar el curso en línea de Andrew Ng.

Creo que el curso de Ng es especialmente puntual y excepcionalmente eficiente, por lo que es un conocido extraordinario para alguien que necesita ingresar a ML. Me sorprende cuando los individuos me revelan que el curso es “excesivamente fundamental” o “excesivamente superficial”.

Ante la posibilidad de que me revelen que solicito que aclaren el contraste entre Regresión logística y SVM de kernel lineal, PCA versus Factorización matricial, regularización o pendiente de gradiente. He hablado con los aspirantes que afirmaron años de encuentro de ML que no sabían la respuesta a estas preguntas. En su mayor parte están claramente aclarados en el curso de Ng.

Hay muchos otros cursos en línea que puede tomar después de este, pero ahora está en su mayor parte preparado para pasar a la siguiente etapa.

Vea mi publicación anterior Los 10 mejores videos, profesores y cursos sobre aprendizaje automático para principiantes y avanzados

PASO 3.) Algunas sugerencias de libros

Mi paso subsiguiente sugerido es obtener un libro decente de LD (mi resumen más abajo), leer las secciones principales de introducción, y después de que el rebote a cualquier parte incorpore un algoritmo, está interesado. Cuando hayas descubierto que algo, salta a él, observa cada uno de los puntos de interés y, en particular, implementalo. En el último paso del curso en línea, a partir de ahora, habría actualizado algunos algoritmos en Octave. Sea como sea, aquí estoy mirando la ejecución de un algoritmo sin ninguna preparación en un lenguaje de programación “real”. En cualquier caso, puede comenzar con uno simple, por ejemplo, Regresión logística regularizada por L2, o k-means, pero también debería esforzarse para actualizar todos los más interesantes, por ejemplo, SVM. Puede utilizar una implementación de referencia en una de las muchas bibliotecas existentes para asegurarse de que está obteniendo resultados equivalentes.

  • El razonamiento bayesiano de David Barber y el aprendizaje automático
  • Aprendizaje automático de Kevin Murphy: una perspectiva probabilística
  • Google dice que el aprendizaje automático es el futuro
  • Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman
  • Reconocimiento de patrones del obispo y aprendizaje automático
  • Andrew Ng OpenClassRoom Stanford
  • Aprendizaje de máquina de Mitchell

También hay numerosos libros geniales que se centran en un tema específico. Por ejemplo, Sutton and Re-Inforcement Learning es una obra de arte. Además, el libro Deep Learning (accesible en la web) prácticamente se está convirtiendo en un ejemplar antes de su distribución. Sea como sea, necesita un par de esos libros para reunir un grado de comprensión de gran alcance y equilibrado del campo.

Ver mi post anterior 10 libros electrónicos gratuitos que debes leer sobre conceptos básicos de aprendizaje automático .

Asimismo, puede ir específicamente a un trabajo de investigación que presente un algoritmo o enfoque que le interese y se sumerja en él.

PASO 4.) La mayoría de los algoritmos esenciales

Se confía en usted para conocer las tuercas y los tornillos de un algoritmo esencial.

Ver mis algoritmos posteriores a 15 algoritmos que los ingenieros de aprendizaje deben conocer .

En cualquier caso, además de los algoritmos, también es fundamental saber cómo configurar sus datos (selección de características, transformación y compresión) y cómo evaluar sus modelos. Tal vez, como iniciador, podría ver nuestro Aprendizaje de máquina en el ejercicio de instrucción scikit-learn en SciPy 2016. Condensa una gran parte de los rudimentos al presentar la biblioteca de scikit-learn, que puede resultar útil para la ejecución y otros exámenes. :

PASO 5.) Juega con unos enormes conjuntos de datos que son accesibles de forma abierta.

Descubra un conjunto de datos que le parezca especialmente intrigante o sobre el que tenga hipótesis y verifique si tiene razón.

a.) Datos del gobierno de los EE. UU. http://www.data.gov/

b.) Contender en Kaggle o construir algo con uno de sus conjuntos de datos, es realmente divertido y genuino. https://www.kaggle.com/

“Kaggle es una plataforma para el modelado predictivo y las competiciones de análisis en las que las empresas e investigadores publican sus datos, y los estadísticos y mineros de datos de todo el mundo compiten para producir los mejores modelos”. – Wiki

Kaggle lo expone a una amplia gama de problemas de Aprendizaje automático, las competiciones de Kaggle lo obligan a codificar y a codificar su solución de la manera más eficiente posible, haciendo concesiones entre el tiempo del programador, el tiempo de CPU, RAM, etc. Cada competencia tiene un Foro donde los competidores se ayudan entre sí para abordar el problema. Estarás compitiendo contra algunos de los mejores ingenieros del mundo. Finalmente, los reclutadores están recorriendo las tablas de Kaggle en busca de ingenieros talentosos. Podrías encontrar una nueva posición .

Debería comenzar su kaggle con Titanic porque, debido a que hay muchos scripts / problemas accesibles, tendrá la capacidad de construir diversos tipos de modelos que también le permitirán comprender algunos de los algoritmos de aprendizaje automático.

A continuación, puede ocuparse de un tema interesante. Reclutar en Facebook por qué, dado que dada la facilidad de la estructura de datos y la extravagancia del contenido , puede unirse a las tablas correctas y hacer un cálculo preciso en este caso.

Cuando haya terminado con estos dos, debería estar listo para abordar temas más interesantes de acuerdo con su interés.

He enumerado 40 proyectos divertidos de aprendizaje a máquina para principiantes en aprendizaje automático. Cuando termine, puede echar un vistazo a los 35 principales proyectos de aprendizaje automático en Github para obtener más inspiración.

Algunos sitios que pueden ayudarlo a resolver problemas : https: //stackoverflow.com , http : //www.gitxiv.com/ , http://www.arxiv-sanity.com/ , https://arxiv.org/

PASO 6.) Participa en un aprendizaje automático centrado en el producto o en un evento Attend ML.

El grupo que busca debe estar cargado de ingenieros a los que desea instruir y aprender. Esto te ayudará a convertirte en un buen ingeniero de aprendizaje automático. Del mismo modo, al separar un grupo de productos, rápidamente descubrirás cómo la ciencia y la hipótesis del aprendizaje automático varían de la capacitación. Específicamente, cómo la conducta del cliente le mostrará algo nuevo cada día.

Vaya a los eventos de aprendizaje automático en los que puede darse cuenta de lo que hace la gente en las charlas y participar con hackathons, ejercicios de instrucción y talleres como:

La conferencia de aprendizaje automático

Conferencia de estratos de O’Reilly

PyData

Conferencia de datos ricos de Crowdflower

¡Buena suerte!

Hola,

Si desea aprender Aprendizaje automático, le sugiero que se una a un programa de capacitación porque no es suficiente para adquirir solo conocimientos teóricos, debe saber cómo usarlo en el mundo real. Y al capacitarse obtendrá la orientación adecuada, en la orientación de alguien que podrá aprender rápidamente. También trate de leer en línea e implementar esas habilidades prácticamente.

El aprendizaje automático es una forma de inteligencia artificial (IA) que proporciona a los sistemas informáticos la capacidad de estudiar sin ser programado explícitamente. El dominio de la máquina se centra en el desarrollo de aplicaciones informáticas que pueden intercambiarse mientras se exponen a nueva información.

Además, Webtunix Solutions es una de las mejores organizaciones de investigación de inteligencia artificial en Chandigarh que está trabajando en marcos web inteligentes como MATLAB, Python, Hadoop, Big Data y Java.

Hay algunos sitios web excelentes donde puedes encontrar cursos, gratuitos o de pago, algunos de ellos están orientados a la práctica (como Udemy, Treehouse y Udacity), mientras que otros están más orientados a lo académico (como Coursera, Edx ..)

Puede comparar cursos de aprendizaje automático de diferentes sitios web aquí: CourseFit

Aquí hay un vistazo:

  • Curso de Udacity: Machine Learning | Udacity
  • curso de udemy: Data Science: Supervised Machine Learning en Python

feliz aprendizaje

Sí, puedes aprender Aprendizaje automático por tu cuenta con la ayuda de expertos en línea. Mejor tomar cualquier curso en línea, hay muchos cursos de ML en línea hay en el mundo. Te sugeriré los mejores cursos de aprendizaje automático en línea.

Aprendizaje automático AZ ™: práctica en Python & R en Data Science

Aprenderás

  • Master Machine Learning en Python & R
  • Tener una gran intuición de muchos modelos de Machine Learning.
  • Hacer predicciones precisas
  • Hacer poderoso analisis
  • Hacer modelos robustos de Machine Learning.
  • Cree un fuerte valor añadido para su negocio.
  • Utilice el aprendizaje automático para fines personales
  • Manejar temas específicos como aprendizaje de refuerzo, PNL y aprendizaje profundo
  • Manejar técnicas avanzadas como la reducción de dimensiones.
  • Sepa qué modelo de Machine Learning elegir para cada tipo de problema
  • Construye un ejército de poderosos modelos de Machine Learning y sabe cómo combinarlos para resolver cualquier problema.

Este curso ha sido diseñado por dos científicos de datos profesionales para que podamos compartir nuestro conocimiento y ayudarlo a aprender teorías complejas, algoritmos y bibliotecas de codificación de una manera sencilla.

Este curso es divertido y emocionante, pero al mismo tiempo nos sumergimos profundamente en el Aprendizaje automático. Se estructura de la siguiente manera:

  • Parte 1 – Preprocesamiento de datos
  • Parte 2 – Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinomial, RVS, Regresión del árbol de decisión, Regresión aleatoria de bosques
  • Parte 3 – Clasificación: Regresión logística, K-NN, SVM, SVM del núcleo, Bayes ingenuos, Clasificación del árbol de decisión, Clasificación de bosques aleatorios
  • Parte 4 – Agrupación en clúster: K-medias, agrupación jerárquica
  • Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
  • Parte 6: Aprendizaje por refuerzo: confianza superior, muestreo de Thompson
  • Parte 7 – Procesamiento de lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
  • Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
  • Parte 9 – Reducción de la dimensionalidad: PCA, LDA, PCA de núcleo
  • Parte 10 – Selección de modelo y realce: validación cruzada en k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está lleno de ejercicios prácticos que se basan en ejemplos en vivo. Así que no solo aprenderá la teoría, sino que también obtendrá práctica práctica en la construcción de sus propios modelos.

Y como beneficio adicional, este curso incluye plantillas de código R y Python que puede descargar y usar en sus propios proyectos.

Recursos adicionales ; –

Python para Data Science y Machine Learning Bootcamp

Estadística para la ciencia de datos y análisis de negocios

Automatizando la exploración de datos con R

Todo lo mejor .

  1. Esté preparado para un montón de googlear. Especialmente el desbordamiento de pila. Y también es fácil para ti mismo porque te quedarás atascado 20 a 30 veces en el camino.
  2. Termina el libro, ISLR (Intro to ML stats). Lee los conceptos básicos de probabilidad si no entiendes el libro. Pero esencialmente hay que dominar todos los conceptos fundamentales.
  3. Simultáneamente comienza la codificación en R y Python. Elige una que más te guste. ISLR tiene códigos R de todos modos, y muchos cursos en línea tienen códigos Python para ISLR.
  4. Recoge un conjunto de datos y haz un proyecto completo. Prueba Kaggle con algún conjunto de datos que te parezca interesante.
  5. Copie otras soluciones, lea los blogs de otras personas, solicite sugerencias a sus amigos y a Quora.
  6. Una vez hecho esto, comience a leer nuevos temas que son tendencias, como LSTM y CNN.
  7. Una vez hecho esto, incluso, comience a leer trabajos de investigación para ver nuevos modelos híbridos y desarrollar el conocimiento de su dominio.

Los cursos en línea de Stanford son realmente buenos para aprender por tu cuenta. Puedes encontrar cursos de aprendizaje automático allí. Pero seguramente este curso requiere requisitos previos y algunos conocimientos previos.

Echa un vistazo a Cómo iniciar AI / ML / DL desde cero. ¡¡Buena suerte!!