Cómo aprender rápido de máquina

Tratar de aprender el aprendizaje automático es una receta para el desastre. Hay tanto que necesita saber para hacer cualquier tipo de trabajo significativo.

El mito del ingeniero asistido por herramientas.

Recientemente, los proveedores de PaaS como AWS, Microsoft Azure, IBM Bluemix y Google Cloud han comercializado sus plataformas de aprendizaje automático como herramientas mágicas que convertirán a cualquier ingeniero de software en un científico de datos así. Bueno, eso es sólo una tontería de marketing. Las herramientas no son buenas sin una comprensión adecuada de los fundamentos.

Un científico de datos no calificado hará más daño que bien.

El peligro de tratar de saltar directamente al aprendizaje automático profesional es que puede crear algo que parezca tener sentido.

Con otras áreas de la ingeniería de software, como el desarrollo web, generalmente es muy fácil exponer algo que apesta, porque lo que ves es lo que obtienes. En el aprendizaje automático, obtienes un montón de números en su mayor parte. A menudo es casi imposible para el usuario final saber si tiene sentido o no.

Las suposiciones incorrectas son malvadas.

Un científico de datos sin experiencia puede entrenar un modelo y enviarlo a producción una vez que la precisión alcance un alto porcentaje, ajeno a las suposiciones incorrectas que se hicieron al hacerlo.

Saber cuándo su modelo es excesivo y cuándo tiene correlaciones espurias es algo que viene con una sólida comprensión y experiencia teórica.

Aprende el aprendizaje automático de la manera difícil, pero correcta.

Este es el mejor consejo que puedo dar a alguien que está empezando.

  1. Sumérgete en todo el material de aprendizaje que puedas encontrar. Asistir a los MOOCs en Coursera y Udacity. Busca conceptos en Wikipedia y en Quora. Ver conferencias y charlas en YouTube. Leer papeles y libros.
  2. Empieza a practicar temprano, pero empieza poco a poco. Implemente algoritmos simples como regresión lineal, descenso de gradiente, agrupamiento de k-means, vecinos más cercanos a k y Bayes ingenuos antes de avanzar a cosas más avanzadas.
  3. Implementar algoritmos desde cero. Intente hacer esto una vez con cada algoritmo antes de comenzar a usar las bibliotecas. Solo de esta manera puedes entender completamente cómo funcionan realmente.
  4. Comience con conjuntos de datos de juguete. Si no puede hacer que un algoritmo funcione en un conjunto de datos pequeño y limpio, no hay forma de que funcione en un conjunto de datos grande y desordenado del mundo real.

Solo cuando hayas seguido estos pasos, estarás listo para quitarte las ruedas de entrenamiento y atacar problemas empresariales reales. Tomará tiempo, pero no existe una solución rápida para dominar el aprendizaje automático.

El aprendizaje de ML lo haría más conocedor de la ciencia de datos y por lo tanto más atractivo en el mercado laboral .

El aprendizaje automático es el delirio del momento. Toneladas de compañías están haciendo todo lo posible para contratar ingenieros competentes, ya que ML se está convirtiendo gradualmente en el cerebro detrás de la inteligencia de negocios. A través de él, las empresas pueden dominar las preferencias de los consumidores, lo que aumenta las ganancias. Necesitas tener algunos conocimientos de programación en tu haber para comenzar. Python es útil, ya que se utiliza en muchos proyectos de aprendizaje automático debido a su posesión de toneladas de bibliotecas de ciencia de datos. También es relativamente fácil de aprender y comprender.

El aprendizaje automático se basa mucho en cuatro áreas en matemáticas:

Estadística

Álgebra lineal

Cálculo

Probabilidad

Si no te sientes cómodo con las matemáticas, no te preocupes. Muchas de las cosas que realmente necesitas aprender para comenzar son bastante básicas.

También puedes aprender ML de muchos cursos en línea:

Te sugeriré los mejores cursos:

Aprendizaje automático AZ ™: práctica en Python & R en Data Science [recomendado]

El curso anterior es el más preferible.

Este curso es divertido y emocionante, pero al mismo tiempo nos sumergimos profundamente en el Aprendizaje automático. Se estructura de la siguiente manera:

· Parte 1 – Preprocesamiento de datos

· Parte 2 – Regresión: regresión lineal simple, regresión lineal múltiple, regresión polinomial, RVS, regresión de árbol de decisión, regresión aleatoria de bosques

· Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación de árboles de decisión, Clasificación de bosques aleatorios

· Parte 4 – Agrupación en clúster: K-medias, agrupación jerárquica

· Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat

· Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson

· Parte 7 – Procesamiento de lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL

· Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales

· Parte 9 – Reducción de la dimensionalidad: PCA, LDA, Kernel PCA

· Parte 10 – Selección de modelo y realce: validación cruzada de k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está lleno de ejercicios prácticos que se basan en ejemplos en vivo. Así que no solo aprenderá la teoría, sino que también obtendrá práctica práctica en la construcción de sus propios modelos.

De esto puedes saber:

· Master Machine Learning en Python & R

· Tener una gran intuición de muchos modelos de Aprendizaje Automático.

· Hacer predicciones precisas

· Hacer un análisis poderoso.

· Hacer modelos robustos de Machine Learning.

· Crear un fuerte valor añadido a su negocio.

· Utilizar el aprendizaje automático para fines personales.

· Manejar temas específicos como aprendizaje de refuerzo, PNL y aprendizaje profundo

· Manejar técnicas avanzadas como la reducción de dimensiones.

· Saber qué modelo de Machine Learning elegir para cada tipo de problema

· Construye un ejército de poderosos modelos de Machine Learning y sabe cómo combinarlos para resolver cualquier problema.

También te puedo sugerir algunos cursos más:

· Python para Data Science y Machine Learning Bootcamp

· Ciencia de datos y Bootcamp de aprendizaje automático con R

Desde el primer curso puedes obtener el siguiente …

A continuación, algunos de los temas que aprenderemos:

· Programación con Python

· NumPy con Python

· Uso de marcos de datos pandas para resolver tareas complejas

· Usa pandas para manejar archivos de Excel

· Web scraping con python

· Conectar Python a SQL

· Utilice matplotlib y seaborn para visualizaciones de datos

· Usar plotly para visualizaciones interactivas

· Aprendizaje automático con SciKit Learn, que incluye:

· Regresión lineal

· K vecinos más cercanos

· K significa agrupación

· Árboles de decisión

· Bosques aleatorios

· Procesamiento natural del lenguaje

· Redes neuronales y aprendizaje profundo.

· Máquinas de soporte de vectores

· ¡y mucho, mucho más!

También puedes ir a través de algunos libros de texto:

Libros de texto sugeridos:

· Aprendizaje automático para principiantes absolutos: una introducción en inglés sencillo por Oliver Theobald

· Python Machine Learning: Machine Learning y Deep Learning con Python, scikit-learn y TensorFlow, 2ª edición por Sebastian Raschka y Vahid Mirjalili

No hay parada ML en el mundo de hoy. Si estás ansioso por mejorar tu carrera, aprender ML podría ser el camino a seguir.

TODO LO MEJOR……………….

¿Por qué quieres aprender el aprendizaje automático rápido? Claro, puedes aprender Aprendizaje automático rápido pero no te traerá nada. Salgamos de la ciencia de datos y tomemos cualquier personalidad deportiva como ejemplo aquí. Leyendas del cricket Rahul Dravid, Sachin Tendulkar, Brian Lara o Ricky Ponting. Ninguno de estos fue a un campo de entrenamiento de cricket de 30 días y se convirtió en lo que son hoy. Si te apresuras por lo básico, nunca podrás escalar. Te sugiero que te tomes tu tiempo. Las cosas buenas toman tiempo.

Puedo ayudarte en cuanto a cómo debes aprender Aprendizaje automático. Dibujaré una hoja de ruta y cómo abordarlos, pero antes de eso es de suma importancia saber algunas cosas sobre el aprendizaje automático.

Refuerce sus conceptos básicos: he estado interactuando con algunos aspirantes últimamente, y la mayoría de ellos le dan mucha importancia a las matemáticas. El aprendizaje automático se basa no solo en las matemáticas, sino también en las estadísticas y la programación. La gente suele pasar por alto la parte de la programación, que es un gran error.

Estadística

  • Variables aleatorias
  • Distribuciones estadísticas
  • Teoría de probabilidad (Cálculo de MGF, CGF, Media, Mediana, Modo, Varianza, Expectativa de máxima verosimilitud, Teoremas del límite central, ANOVA)
  • Ajuste de una distribución
  • Muestreo
  • Prueba de una hipótesis
  • Modelado bayesiano
  • Regresión y series de tiempo

Programación

Ahora aquí, hay mucho debate sobre Python vs R. Ambos idiomas tienen sus propios pros y contras. Personalmente, recomendaría Python, ya que es un lenguaje general de usos múltiples y tiene muchas bibliotecas de visualización como Bokeh, Seaborn y Pygal.

  • Python intermedio para la ciencia de datos
  • Importando datos en Python
  • Fundación pandas
  • Bases de datos en Python
  • Manipular DataFrames con pandas
  • Visualización de datos con Python
  • NumPy, Scikit learn y Model Evaluation
  • Visualización de datos con bokeh
  • Fusionando DataFrames con pandas

Después de completar esto, tendría un sólido conocimiento de los conceptos básicos necesarios para desarrollar una intuición para el aprendizaje automático.

¿Qué es el aprendizaje automático?

El aprendizaje automático es el desarrollo de programas informáticos que pueden acceder a los datos y aprenderlos por sí mismos. Esto se puede hacer utilizando algoritmos. Hemos clasificado los algoritmos en 3 categorías. Supervisado, No Supervisado y Refuerzo.

Algunos ‘deben saber’ algoritmos ML.

  • Algoritmo clasificador Naïve Bayes
  • K significa algoritmo de agrupamiento
  • Vector de la máquina algoritmo de apoyo
  • Algoritmo de apriori
  • Regresión lineal
  • Regresión logística
  • Redes neuronales artificiales
  • Bosques aleatorios
  • Árboles de decisión
  • Vecinos más cercanos

Asista a más reuniones: aunque el requisito principal para convertirse en un científico de datos será solo a través de la práctica. Siempre es bueno tener una red social. Debes comenzar a asistir a más y más reuniones sobre Aprendizaje automático. Tienes la oportunidad de aprender mucho.

Comience con pasantías: también puede intentar trabajar junto con el aprendizaje. Puede optar por pasantías en algunas de las compañías de Data Science. Obtendrá la experiencia de la industria con el conocimiento académico que cubrirá al estudiar estos temas. La mayoría de las grandes empresas de tecnología usan Data Science. Todas estas empresas deben tener puestos de pasantías de aprendizaje automático. Te recomendaría ir a Internshala, Linkedin, Glassdoor, Monster y buscar prácticas de aprendizaje automático.

Descargo de responsabilidad: Soy un co-fundador de @GreyAtom, ayudando a los talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom apunta a ser mentor profesional y novedoso en el inicio de su carrera en Data Science. Los estudiantes construyeron proyectos sobre conjuntos de datos reales y declaraciones de problemas proporcionados por nuestra industria y socios contratantes. El programa se basa en el aula y está muy orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, los profesionales de la industria y las personas influyentes.

Algunos enlaces rápidos

Las otras respuestas dicen “no” o “no puedes”. Quería dar una respuesta más práctica.

Hablando de manera práctica en términos de habilidades, si conoce muchas matemáticas y puede entender fácilmente las suposiciones detrás de los modelos comunes, aprenderá el aprendizaje automático más rápidamente. Conner Davis, por ejemplo, ha hablado de esto en una de sus respuestas, donde menciona que observó algunas clases de aprendizaje automático de Coursera a una velocidad 2x, porque conoce las matemáticas lo suficiente como para entenderlas de inmediato. Tuve una experiencia similar, siendo un estudiante de matemáticas.

Algunos ejemplos:

  • Si ya sabe SVD, entonces PCA debería ser inmediatamente obvio para usted una vez que lo lea.
  • Si se siente muy cómodo con las matrices y las derivadas parciales, la optimización de las funciones de pérdida de los modelos es un concepto fácil, ya sea una solución de forma cerrada en el caso de OLS, o descenso de gradiente o descenso de gradiente estocástico. Esto no quiere decir que inmediatamente sabría la teoría de la optimización, pero en muchos casos solo puede usar el descenso de gradiente, y tal vez recoger un libro de texto más tarde para descubrir algo mejor.

Ser bueno en matemáticas te ayuda a evitar el peligro de usar malas suposiciones o lanzar modelos al azar porque tienes una mejor comprensión intuitiva de lo que estas cosas realmente están calculando y prediciendo. También le ayuda a aprender las estadísticas y la teoría de la optimización más rápidamente, lo cual es útil si aún no sabe mucho.

Así que las matemáticas te ayudan a aprender más rápido, pero luego debes poner el trabajo en práctica. En mi opinión, la mejor manera de encontrar motivación es conseguir un trabajo relacionado con el aprendizaje automático, ya que trabajar muchas horas al día garantiza que lo piense. Además, en un entorno de trabajo, el objetivo es encontrar algo útil, que es una buena manera de acostumbrarse a pensar en términos de restricciones empresariales, valor agregado y buenas heurísticas.

Si no puede obtener un trabajo que utilice el aprendizaje automático, puede intentar girar lentamente hacia él. Si está comenzando desde la ingeniería de software, intente hacer más cosas relacionadas con datos y cosas relacionadas con el análisis. Si está comenzando desde un tipo de rol de analista de operaciones de negocios, intente aprender más sobre estadísticas y aprenda a usar herramientas de análisis basadas en código en lugar de Excel.

Sólo mis 2 centavos.

Para aprender el aprendizaje automático rápido, debes ser mejor que el promedio en matemáticas. Aquí están las matemáticas que debe aprender teniendo en cuenta el objetivo final para estar preparado.

  • Álgebra lineal-Álgebra lineal – MIT 18.06 Álgebra lineal por Gilbert Strang
  • Teoría de probabilidad-Probabilidad y estadística – MIT 6.041 Análisis probabilístico de sistemas y probabilidad aplicada por John Tsitsiklis
  • Cálculo
  • Cálculo de variaciones
  • Teoría de grafos
  • Métodos de optimización (multiplicadores de Lagrange)
  • Cualquier lenguaje de programación que sea ampliamente utilizado para ML como python, MATLAB o C ++.

PD: recomendaría Python aquí como idioma y recomendaría los siguientes enlaces:

  • Aprendizaje automático con texto en scikit-learn (PyCon 2016)
  • Aprendizaje automático en Python con scikit-learn

Una vez cumplidos estos requisitos, por fin puede comenzar a considerar el Aprendizaje automático.

6 PASOS FÁCILES PARA UTILIZAR EL APRENDIZAJE EN MÁQUINA?

Este es el lugar donde comienza la diversión. Ahora, se espera que la fundación comience a echar un vistazo a algunos datos. La mayoría de las empresas de aprendizaje automático tienen básicamente el mismo proceso de trabajo:

PASO 1.) Fabrique sus fundamentos de aprendizaje automático estudiando algunos materiales relacionados con el tema:

a.) Las conferencias de Aprendizaje automático de Andrew Ng son un gran comienzo:

Colección de conferencias | Aprendizaje automático – YouTube

b.) Certificado de aplicaciones y minería de datos de Stanford:

Certificado de postgrado en minería de datos y solicitudes

c.) Escuela de verano de aprendizaje automático:

https://www.youtube.com/playlist

d.) Un enlace a la lista de reproducción completa está aquí (Lecture Collection | Machine Learning)
https://www.youtube.com/view_pla

e.) “La mejor introducción de aprendizaje automático que he visto hasta ahora”.

PASO 2.) Toma un curso en línea

Lo principal que aconsejo a alguien que necesita aprender aprendizaje automático es tomar el curso en línea de Andrew Ng.

Creo que el curso de Ng es especialmente puntual y excepcionalmente eficiente, por lo que es un conocido extraordinario para alguien que necesita ingresar a ML. Me sorprende cuando los individuos me revelan que el curso es “excesivamente fundamental” o “excesivamente superficial”. Ante la posibilidad de que me revelen que solicito que aclaren el contraste entre Regresión logística y SVM de kernel lineal, PCA versus Factorización matricial, regularización o pendiente de gradiente. He hablado con los aspirantes que afirmaron años de encuentro de ML que no sabían la respuesta a estas preguntas. En su mayor parte están claramente aclarados en el curso de Ng. Hay muchos otros cursos en línea que puede tomar después de este, pero ahora está en su mayor parte preparado para pasar a la siguiente etapa.

Vea mi publicación anterior Los 10 mejores videos, profesores y cursos sobre aprendizaje automático para principiantes y avanzados

PASO 3.) Algunas sugerencias de libros.

Mi paso subsiguiente sugerido es obtener un libro decente de LD (mi resumen más abajo), leer las secciones principales de introducción, y después de que el rebote a cualquier parte incorpore un algoritmo, está interesado. Cuando hayas descubierto que algo, salta a él, observa cada uno de los puntos de interés y, en particular, implementalo. En el último paso del curso en línea, a partir de ahora, habría actualizado algunos algoritmos en Octave. Sea como sea, aquí estoy mirando la ejecución de un algoritmo sin ninguna preparación en un lenguaje de programación “real”. En cualquier caso, puede comenzar con uno simple, por ejemplo, Regresión logística regularizada por L2, o k-means, pero también debería esforzarse para actualizar todos los más interesantes, por ejemplo, SVM. Puede utilizar una implementación de referencia en una de las muchas bibliotecas existentes para asegurarse de que está obteniendo resultados equivalentes.

  • El razonamiento bayesiano de David Barber y el aprendizaje automático
  • Aprendizaje automático de Kevin Murphy: una perspectiva probabilística
  • Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman
  • Reconocimiento de patrones del obispo y aprendizaje automático
  • Aprendizaje de máquina de Mitchell

También hay numerosos libros geniales que se centran en un tema específico. Por ejemplo, Sutton and Re-Inforcement Learning es una obra de arte. Además, el libro Deep Learning (accesible en la web) prácticamente se está convirtiendo en un ejemplar antes de su distribución. Sea como sea, necesita un par de esos libros para reunir un grado de comprensión de gran alcance y equilibrado del campo.

Ver mi publicación anterior 10 libros electrónicos gratuitos que debes leer sobre los conceptos básicos del aprendizaje automático.

Asimismo, puede ir específicamente a un trabajo de investigación que presente un algoritmo o enfoque que le interese y se sumerja en él.

PASO 4.) La mayoría de los algoritmos esenciales

Se confía en usted para conocer las tuercas y los tornillos de un algoritmo esencial.

Ver mis algoritmos posteriores a 15 algoritmos que los ingenieros de aprendizaje deben conocer.

En cualquier caso, además de los algoritmos, también es fundamental saber cómo configurar sus datos (selección de características, transformación y compresión) y cómo evaluar sus modelos. Tal vez, como iniciador, podría ver nuestro Aprendizaje de máquina en el ejercicio de instrucción scikit-learn en SciPy 2016. Condensa una gran parte de los rudimentos al presentar la biblioteca de scikit-learn, que puede resultar útil para la ejecución y otros exámenes. :

PASO 5.) Juega con unos enormes conjuntos de datos que son accesibles de forma abierta.

Descubra un conjunto de datos que le parezca especialmente intrigante o sobre el que tenga hipótesis y verifique si tiene razón.

Datos del gobierno de los Estados Unidos http://www.data.gov/

Empresa Ferroviaria de Catering y Turismo http://www.irctc.co.in

PASO 6.) Participe en un equipo de aprendizaje automático o personalización centrado en el producto.

El grupo que busca debe estar cargado de ingenieros a los que desea instruir y aprender. Esto te ayudará a convertirte en un buen ingeniero de aprendizaje automático. Del mismo modo, al separar un grupo de productos, rápidamente descubrirás cómo la ciencia y la hipótesis del aprendizaje automático varían de la capacitación. Específicamente, cómo la conducta del cliente le mostrará algo nuevo cada día.

No lo aprendas rápido. Aprendelo bien

Si aún insiste en aprender rápido de Aprendizaje automático, busque el algoritmo Perceptron. Lee el algoritmo. Intenta implementarlo en tu lenguaje de programación favorito. Si aún no te has quedado sin tiempo, lee algunas cosas teóricas sobre el algoritmo de perceptrón.

Hay que ir Sabes que has aprendido un algoritmo de Aprendizaje automático, y te tomó aproximadamente un día (quizás solo una hora, tal vez una semana, dependiendo de la cantidad de teoría que quisieras aprender). Bien hecho.

Podría argumentar que el algoritmo de perceptrón es muy limitado y no puede resolver todos los problemas. Bueno, mala suerte. Si desea aprender otros algoritmos, tomará más tiempo. Especialmente si desea comprenderlos realmente, y saber cuándo puede aplicarlos y qué garantías ofrecen.

Si realmente insistes, ¿por qué no buscas el algoritmo k-means? Ahora ya sabes 2 algoritmos! ¡Brillante!

Lo sentimos, “aprendizaje” El aprendizaje automático no debe hacerse rápido. Si se hace rápido, estará lejos de ser un experto, y probablemente utilizará las técnicas incorrectas para una situación determinada, y no entenderá las limitaciones de las técnicas que conoce.

Aprendelo bien Apréndelo profundamente. No se centre solo en desarrollos y marcos recientes, sino que aprenda todos los algoritmos esenciales de aprendizaje automático. Los métodos desarrollados en los años 50 (perceptrón), 60 (vecino más cercano) y 70 (propagación hacia atrás) siguen siendo válidos y se utilizan en la actualidad. Muchos otros métodos del pasado ya no se utilizan hoy en día, pero es importante saber y entender por qué han sido reemplazados.

Puedes ver este artículo que te ayudará con un rápido aprendizaje haciendo clic aquí.

Con un trabajo como ML Engineer / o DS y con compañeros / jefes / compañeros de trabajo que entienden muy bien a ML.

Estarías seguro de aprender rápido.