Cómo aprender Machine Learning en 35 días.

35 días es un período corto de tiempo, saber el camino a seguir podría ayudarlo a llegar a su destino más rápido. Los fundamentos básicos requeridos para el aprendizaje automático son:

  1. Fundamentos del lenguaje de scripting R / Python
  • Varios tipos de datos en R / Python
  • Operadores relacionales y logicos
  • Declaraciones condicionales y declaraciones en bucle
  • Funciones personalizadas e integradas
  • Importando datos

2. Estadísticas:

  • Probabilidad
  • Diferentes tipos de probabilidad
  • Distribución de probabilidad y conceptos de densidad.
  • Inferencia bayesiana
  • Parámetros estadísticos
  • Diferentes tipos de pruebas estadísticas

3. Análisis de datos

  • Proceso de cuestionamiento
  • Disputa
  • Explorador
  • Analizando
  • Comunicando datos

4. Visualizaciones y adquisición de conocimientos estadísticos para resumir datos.

Entonces ven al aprendizaje automático:

  • ¿Qué es el aprendizaje automático ?
  • Diferentes algoritmos de aprendizaje automático
  • Algoritmos esenciales de aprendizaje automático , tales como árbol de decisión, bosque aleatorio, regresión lineal / logística, SVM, etc.
  • Concepto de modelo sobre ajuste y bajo ajuste.
  • Parámetros y métodos de evaluación del modelo.
  • Modelo de impulso

Para más referencia de blog:

Tutorial de ciencia de datos para principiantes | Aprender Ciencia de Datos | Edureka

Para referencia de video:

¿Por qué quieres aprender el aprendizaje automático rápido? Claro, puedes aprender Aprendizaje automático rápido pero no te traerá nada. Salgamos de la ciencia de datos y tomemos cualquier personalidad deportiva como ejemplo aquí. Leyendas del cricket Rahul Dravid, Sachin Tendulkar, Brian Lara o Ricky Ponting. Ninguno de estos fue a un campo de entrenamiento de cricket de 30 días y se convirtió en lo que son hoy. Si te apresuras por lo básico, nunca podrás escalar. Te sugiero que te tomes tu tiempo. Las cosas buenas toman tiempo.

Puedo ayudarte en cuanto a cómo debes aprender Aprendizaje automático. Dibujaré una hoja de ruta y cómo abordarlos, pero antes de eso es de suma importancia saber algunas cosas sobre el aprendizaje automático.

Refuerce sus conceptos básicos: he estado interactuando con algunos aspirantes últimamente, y la mayoría de ellos le dan mucha importancia a las matemáticas. El aprendizaje automático se basa no solo en las matemáticas, sino también en las estadísticas y la programación. La gente suele pasar por alto la parte de la programación, que es un gran error.

Estadística

  • Variables aleatorias
  • Distribuciones estadísticas
  • Teoría de probabilidad (Cálculo de MGF, CGF, Media, Mediana, Modo, Varianza, Expectativa de máxima verosimilitud, Teoremas del límite central, ANOVA)
  • Ajuste de una distribución
  • Muestreo
  • Prueba de una hipótesis
  • Modelado bayesiano
  • Regresión y series de tiempo

Programación

Ahora aquí, hay mucho debate sobre Python vs R. Ambos idiomas tienen sus propios pros y contras. Personalmente, recomendaría Python, ya que es un lenguaje general de usos múltiples y tiene muchas bibliotecas de visualización como Bokeh, Seaborn y Pygal.

  • Python intermedio para la ciencia de datos
  • Importando datos en Python
  • Fundación pandas
  • Bases de datos en Python
  • Manipular DataFrames con pandas
  • Visualización de datos con Python
  • NumPy, Scikit learn y Model Evaluation
  • Visualización de datos con bokeh
  • Fusionando DataFrames con pandas

Después de completar esto, tendría un sólido conocimiento de los conceptos básicos necesarios para desarrollar una intuición para el aprendizaje automático.

¿Qué es el aprendizaje automático?

El aprendizaje automático es el desarrollo de programas informáticos que pueden acceder a los datos y aprenderlos por sí mismos. Esto se puede hacer utilizando algoritmos. Hemos clasificado los algoritmos en 3 categorías. Supervisado, No Supervisado y Refuerzo.

Algunos ‘deben saber’ algoritmos ML.

  • Algoritmo clasificador Naïve Bayes
  • K significa algoritmo de agrupamiento
  • Vector de la máquina algoritmo de apoyo
  • Algoritmo de apriori
  • Regresión lineal
  • Regresión logística
  • Redes neuronales artificiales
  • Bosques aleatorios
  • Árboles de decisión
  • Vecinos más cercanos

Asista a más reuniones: aunque el requisito principal para convertirse en un científico de datos será solo a través de la práctica. Siempre es bueno tener una red social. Debes comenzar a asistir a más y más reuniones sobre Aprendizaje automático. Tienes la oportunidad de aprender mucho.

Comience con pasantías: también puede intentar trabajar junto con el aprendizaje. Puede optar por pasantías en algunas de las compañías de Data Science. Obtendrá la experiencia de la industria con el conocimiento académico que cubrirá al estudiar estos temas. La mayoría de las grandes empresas de tecnología usan Data Science. Todas estas empresas deben tener puestos de pasantías de aprendizaje automático. Te recomendaría ir a Internshala, Linkedin, Glassdoor, Monster y buscar prácticas de aprendizaje automático.

Descargo de responsabilidad: Soy un co-fundador de @GreyAtom, ayudando a los talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom apunta a ser mentor profesional y novedoso en el inicio de su carrera en Data Science. Los estudiantes construyeron proyectos sobre conjuntos de datos reales y declaraciones de problemas proporcionados por nuestra industria y socios contratantes. El programa se basa en el aula y está muy orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, los profesionales de la industria y las personas influyentes.

Algunos enlaces rápidos

35 días solo conocemos los términos y los pequeños conceptos básicos.

Cómo aprender el aprendizaje automático en 90 días, es decir, 3 meses, consulte este artículo.

El aprendizaje automático es un campo verdaderamente vasto y en rápido desarrollo. Será abrumador sólo para comenzar. Sin duda, ha estado saltando en el punto en el que necesita usar la máquina para averiguar cómo construir modelos. Piensa un poco en lo que debe hacer; sin embargo, cuando se filtra la web en busca de algoritmos concebibles, hay muy recientemente un número excesivo de alternativas.

Para aprender el aprendizaje automático, debes ser mejor que el promedio en matemáticas. Aquí están las matemáticas que debe aprender teniendo en cuenta el objetivo final para estar preparado.

  • Álgebra lineal-Álgebra lineal – MIT 18.06 Álgebra lineal por Gilbert Strang
  • Teoría de probabilidad-Probabilidad y estadística – MIT 6.041 Análisis probabilístico de sistemas y probabilidad aplicada por John Tsitsiklis
  • Cálculo
  • Cálculo multivariado
  • Teoría de grafos
  • Métodos de optimización
  • Cualquier lenguaje de programación que sea ampliamente utilizado para ML como python, MATLAB o C ++.

PD: recomendaría Python aquí como idioma y recomendaría los siguientes enlaces:

  • Aprendizaje automático con texto en scikit-learn (PyCon 2016)
  • Aprendizaje automático en Python con scikit-learn
  • Aprendizaje automático con Python

Una vez cumplidos estos requisitos, por fin puede comenzar a considerar el Aprendizaje automático.

6 PASOS FÁCILES PARA UTILIZAR EL APRENDIZAJE EN MÁQUINA?

Este es el lugar donde comienza la diversión. Ahora, se espera que la fundación comience a echar un vistazo a algunos datos. Antes de comenzar, he enumerado 30 cosas que todos deberían saber en Aprendizaje automático . La mayoría de las empresas de aprendizaje automático tienen básicamente el mismo proceso de trabajo:

PASO 1.) Fabrique sus fundamentos de aprendizaje automático estudiando algunos materiales relacionados con el tema:

a.) Las conferencias de Aprendizaje automático de Andrew Ng son un gran comienzo :

b.) Escuela de verano de aprendizaje automático :

c.) Un enlace a la lista de reproducción completa está aquí (Colección de conferencias | Aprendizaje automático)

https://www.youtube.com/view_pla

d.) Certificado de aplicaciones y minería de datos de Stanford :

http://scpd.stanford.edu/public/…

e.) Introducción a la inteligencia artificial por el Prof. Deepak Khemani IIT Madras

http://nptel.ac.in/courses/10610

f.) “La mejor introducción de aprendizaje automático que he visto hasta ahora”.

PASO 2.) Toma un curso en línea

Lo principal que aconsejo a alguien que necesita aprender aprendizaje automático es tomar el curso en línea de Andrew Ng.

Creo que el curso de Ng es especialmente puntual y excepcionalmente eficiente, por lo que es un conocido extraordinario para alguien que necesita ingresar a ML. Me sorprende cuando los individuos me revelan que el curso es “excesivamente fundamental” o “excesivamente superficial”.

Ante la posibilidad de que me revelen que solicito que aclaren el contraste entre Regresión logística y SVM de kernel lineal, PCA versus Factorización matricial, regularización o pendiente de gradiente. He hablado con los aspirantes que afirmaron años de encuentro de ML que no sabían la respuesta a estas preguntas. En su mayor parte están claramente aclarados en el curso de Ng.

Hay muchos otros cursos en línea que puede tomar después de este, pero ahora está en su mayor parte preparado para pasar a la siguiente etapa.

Vea mi publicación anterior Los 10 mejores videos, profesores y cursos sobre aprendizaje automático para principiantes y avanzados

PASO 3.) Algunas sugerencias de libros

Mi paso subsiguiente sugerido es obtener un libro decente de LD (mi resumen más abajo), leer las secciones principales de introducción, y después de que el rebote a cualquier parte incorpore un algoritmo, está interesado. Cuando hayas descubierto que algo, salta a él, observa cada uno de los puntos de interés y, en particular, implementalo. En el último paso del curso en línea, a partir de ahora, habría actualizado algunos algoritmos en Octave. Sea como sea, aquí estoy mirando la ejecución de un algoritmo sin ninguna preparación en un lenguaje de programación “real”. En cualquier caso, puede comenzar con uno simple, por ejemplo, Regresión logística regularizada por L2, o k-means, pero también debería esforzarse para actualizar todos los más interesantes, por ejemplo, SVM. Puede utilizar una implementación de referencia en una de las muchas bibliotecas existentes para asegurarse de que está obteniendo resultados equivalentes.

  • El razonamiento bayesiano de David Barber y el aprendizaje automático
  • Aprendizaje automático de Kevin Murphy: una perspectiva probabilística
  • Google dice que el aprendizaje automático es el futuro
  • Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman
  • Reconocimiento de patrones del obispo y aprendizaje automático
  • Andrew Ng OpenClassRoom Stanford
  • Aprendizaje de máquina de Mitchell

También hay numerosos libros geniales que se centran en un tema específico. Por ejemplo, Sutton and Re-Inforcement Learning es una obra de arte. Además, el libro Deep Learning (accesible en la web) prácticamente se está convirtiendo en un ejemplar antes de su distribución. Sea como sea, necesita un par de esos libros para reunir un grado de comprensión de gran alcance y equilibrado del campo.

Ver mi post anterior 10 libros electrónicos gratuitos que debes leer sobre conceptos básicos de aprendizaje automático .

Asimismo, puede ir específicamente a un trabajo de investigación que presente un algoritmo o enfoque que le interese y se sumerja en él.

PASO 4.) La mayoría de los algoritmos esenciales

Se confía en usted para conocer las tuercas y los tornillos de un algoritmo esencial.

Ver mis algoritmos posteriores a 15 algoritmos que los ingenieros de aprendizaje deben conocer .

En cualquier caso, además de los algoritmos, también es fundamental saber cómo configurar sus datos (selección de características, transformación y compresión) y cómo evaluar sus modelos. Tal vez, como iniciador, podría ver nuestro Aprendizaje de máquina en el ejercicio de instrucción scikit-learn en SciPy 2016. Condensa una gran parte de los rudimentos al presentar la biblioteca de scikit-learn, que puede resultar útil para la ejecución y otros exámenes. :

PASO 5.) Juega con unos enormes conjuntos de datos que son accesibles de forma abierta.

Descubra un conjunto de datos que le parezca especialmente intrigante o sobre el que tenga hipótesis y verifique si tiene razón.

a.) Datos del gobierno de los EE. UU. http://www.data.gov/

b.) Contender en Kaggle o construir algo con uno de sus conjuntos de datos, es realmente divertido y genuino. https://www.kaggle.com/

“Kaggle es una plataforma para el modelado predictivo y las competiciones de análisis en las que las empresas e investigadores publican sus datos, y los estadísticos y mineros de datos de todo el mundo compiten para producir los mejores modelos”. – Wiki

Kaggle lo expone a una amplia gama de problemas de Aprendizaje automático, las competiciones de Kaggle lo obligan a codificar y a codificar su solución de la manera más eficiente posible, haciendo concesiones entre el tiempo del programador, el tiempo de CPU, RAM, etc. Cada competencia tiene un Foro donde los competidores se ayudan entre sí para abordar el problema. Estarás compitiendo contra algunos de los mejores ingenieros del mundo. Finalmente, los reclutadores están recorriendo las tablas de Kaggle en busca de ingenieros talentosos. Podrías encontrar una nueva posición .

Debería comenzar su kaggle con Titanic porque, debido a que hay muchos scripts / problemas accesibles, tendrá la capacidad de construir diversos tipos de modelos que también le permitirán comprender algunos de los algoritmos de aprendizaje automático.

A continuación, puede ocuparse de un tema interesante. Reclutar en Facebook por qué, dado que dada la facilidad de la estructura de datos y la extravagancia del contenido , puede unirse a las tablas correctas y hacer un cálculo preciso en este caso.

Cuando haya terminado con estos dos, debería estar listo para abordar temas más interesantes de acuerdo con su interés.

He enumerado 40 proyectos divertidos de aprendizaje a máquina para principiantes en aprendizaje automático. Cuando termine, puede echar un vistazo a los 35 principales proyectos de aprendizaje automático en Github para obtener más inspiración.

Algunos sitios que pueden ayudarlo a resolver problemas : https://stackoverflow.com , http://www.gitxiv.com/ , http://www.arxiv-sanity.com/ , https://arxiv.org/

PASO 6.) Participa en un aprendizaje automático centrado en el producto o en un evento Attend ML.

El grupo que busca debe estar cargado de ingenieros a los que desea instruir y aprender. Esto te ayudará a convertirte en un buen ingeniero de aprendizaje automático. Del mismo modo, al separar un grupo de productos, rápidamente descubrirás cómo la ciencia y la hipótesis del aprendizaje automático varían de la capacitación. Específicamente, cómo la conducta del cliente le mostrará algo nuevo cada día.

Vaya a los eventos de aprendizaje automático en los que puede darse cuenta de lo que hace la gente en las charlas y participar con hackathons, ejercicios de instrucción y talleres como:

La conferencia de aprendizaje automático

Conferencia de estratos de O’Reilly

PyData

Conferencia de datos ricos de Crowdflower

Sí, es posible aprender Aprendizaje automático en línea en 35 días. Le sugeriré el mejor curso en línea.

Mejor Curso de Aprendizaje Automático

==> Machine Learning AZ ™: Hands-On Python & R en Data Science

Este curso es divertido y emocionante, pero al mismo tiempo nos sumergimos profundamente en el Aprendizaje automático. Se estructura de la siguiente manera:

  • Parte 1 – Preprocesamiento de datos
  • Parte 2 – Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinomial, RVS, Regresión del árbol de decisión, Regresión aleatoria de bosques
  • Parte 3 – Clasificación: Regresión logística, K-NN, SVM, SVM del núcleo, Bayes ingenuos, Clasificación del árbol de decisión, Clasificación de bosques aleatorios
  • Parte 4 – Agrupación en clúster: K-medias, agrupación jerárquica
  • Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
  • Parte 6: Aprendizaje por refuerzo: confianza superior, muestreo de Thompson
  • Parte 7 – Procesamiento de lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
  • Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
  • Parte 9 – Reducción de la dimensionalidad: PCA, LDA, PCA de núcleo
  • Parte 10 – Selección de modelo y realce: validación cruzada en k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está lleno de ejercicios prácticos que se basan en ejemplos en vivo. Así que no solo aprenderá la teoría, sino que también obtendrá práctica práctica en la construcción de sus propios modelos.

==> Machine Learning de la Universidad de Stanford, Mentor: Andrew Ng, cofundador, Coursera

Este curso proporciona una amplia introducción al aprendizaje automático, el análisis de datos y el reconocimiento de patrones estadísticos.

Los temas incluyen:

(i) Aprendizaje supervisado (algoritmos paramétricos / no paramétricos, máquinas de vectores de soporte, núcleos, redes neuronales).

(ii) Aprendizaje no supervisado (agrupamiento, reducción de dimensionalidad, sistemas de recomendación, aprendizaje profundo).

(iii) Mejores prácticas en aprendizaje automático (teoría de sesgo / varianza; proceso de innovación en aprendizaje automático y IA).

El curso también se basará en numerosos estudios de casos y aplicaciones, de modo que también aprenderá cómo aplicar algoritmos de aprendizaje para construir robots inteligentes (percepción, control), comprensión de texto (búsqueda web, antispam), visión artificial, informática médica. , audio, minería de bases de datos, y otras áreas.

Todo lo mejor…

35 días para el aprendizaje automático, espero que tenga una base sólida en matemáticas discretas y que se sienta cómodo con Python o lenguaje relacionado.

Mi sugerencia será el Aprendizaje automático: un enfoque de estudio de caso ofrecido por la Universidad de Washington en Coursera. La razón por la que sugiero este curso es porque tienes muchas manos, y esto te ayudará a construir tu proyecto en paralelo.

Si busca lecciones técnicas más profundas y sólidas, el curso del Prof. Andrew Ng es la mejor opción.

Todo lo mejor

Solo hay una forma en la que puedo pensar (siempre que tenga una comprensión fundamental del cálculo multivariado y el álgebra lineal):

Curso de ANDREW N G (Stanford)

Hay una sesión corriendo en coursera en este momento.

Lea nuestro blog exactamente para este tema, es decir, cómo aprender Aprendizaje automático desde cero y también puede ver nuestro video de YouTube que explica el aprendizaje automático desde cero.

Curso de aprendizaje automático de Stanford en línea en Coursera por Andrew Ng. Le proporciona una visión general de todo lo que se necesita, desde lo básico hasta lo avanzado. Inscríbete en el curso e intenta completar todo a tiempo. Creo que sería suficiente para que explores más tu interés.

A ciegas, vaya para el curso en línea de Andrew Ng en Coursera. Me ayudó mucho.