El aprendizaje automático es un poder energizante y disruptivo en el mundo de la tecnología, y los propietarios de pequeñas empresas querrán ser claros sobre las promesas, los resultados e incluso los riesgos de esta tecnología emergente. ¿Qué tal si paseamos por las 30 cosas más imperativas que todos deberían saber sobre el aprendizaje automático en este momento?
- El aprendizaje automático consiste en datos y algoritmos, pero en su mayor parte datos. Existe una considerable medida de fervor sobre los avances en los algoritmos de aprendizaje automático, y especialmente sobre el aprendizaje profundo. En cualquier caso, los datos son el ingrediente clave que hace que el aprendizaje automático sea concebible. Puede tener aprendizaje automático sin algoritmos modernos, pero no sin grandes datos.
- A menos que tenga muchos datos, debe atenerse a los modelos básicos. El aprendizaje automático entrena un modelo a partir de patrones en sus datos, investigando un espacio de modelos concebibles definidos por parámetros. En el caso de que su espacio de parámetros sea demasiado grande, se adaptará a sus datos de entrenamiento y capacitará a un modelo que no se generalice más allá. Una aclaración punto por punto requiere más cálculos, sin embargo, cuando tenga dudas, debe mantener sus modelos. Tan básico como podría ser permitido.
- El aprendizaje automático solo puede ser tan bueno como los datos que usas para entrenarlo. La frase “ basura en, basura fuera ” es anterior al aprendizaje automático, sin embargo, de manera relevante caracteriza una restricción clave del aprendizaje automático. El aprendizaje automático solo puede encontrar patrones que estén presentes en sus datos de entrenamiento. Para tareas de aprendizaje automático supervisadas , como la clasificación , necesitará una colección vigorosa de datos de capacitación con etiquetas completas y correctamente etiquetados.
- El aprendizaje automático solo funciona si sus datos de entrenamiento son representativos. Al igual que un prospecto de fondo advierte que “el rendimiento pasado no es garantía de resultados futuros”, el aprendizaje automático debe advertir que solo se garantiza que funcione para los datos generados por la misma distribución que generó sus datos de capacitación. Tenga cuidado con los sesgos entre los datos de entrenamiento y los datos de producción, y vuelva a entrenar sus modelos con frecuencia para que no terminen completamente obsoletos.
- La gran mayoría del trabajo duro para el aprendizaje automático es la transformación de datos. Al examinar la acumulación de nuevos procedimientos de aprendizaje automático, puede imaginar que el aprendizaje automático consiste principalmente en seleccionar y ajustar algoritmos. En realidad, es más común: la mayor parte de su tiempo y esfuerzo se destina a la limpieza de datos. y la ingeniería de características – Es decir, cambiando las características en bruto. en características que mejor representan la señal en sus datos.
- El aprendizaje profundo es un avance revolucionario, pero no es una bala mágica. El aprendizaje profundo se ha ganado su entusiasmo por transmitir avances a través de un amplio espectro de zonas de aplicación de aprendizaje automático. Además, el aprendizaje profundo automatiza parte del trabajo que tradicionalmente se realiza a través de la ingeniería de características, especialmente para datos de imagen y video. Pero el aprendizaje profundo no es un proyectil de plata. No puede simplemente utilizarlo fuera del contenedor, independientemente de lo que tenga que hacer un gran esfuerzo en la purificación de datos y el cambio.
- Los sistemas de aprendizaje automático son altamente vulnerables al error del operador. Reflejando a la NRA, “ los algoritmos de aprendizaje automático no matan a las personas; las personas matan a las personas ”. Cuando los sistemas de aprendizaje automático fallan, rara vez se debe a problemas con el algoritmo de aprendizaje automático. Lo más probable es que hayas introducido errores humanos en los datos de entrenamiento, creando sesgos o algún otro error sistemático. Siempre sea escéptico y acérquese al aprendizaje automático con el tren que aplica a la ingeniería de software.
- El aprendizaje automático puede hacer inadvertidamente una profecía inevitable. En numerosas aplicaciones de aprendizaje automático, las elecciones que realice hoy influyen en los datos de capacitación que recopilamos mañana. Una vez que su sistema de aprendizaje automático inserta sesgos en su modelo, puede continuar generando nuevos datos de entrenamiento que fortalecen esos sesgos. Y unos cuantos prejuicios pueden demoler las vidas de las personas. Ten cuidado : no hagas resultados inevitables.
- La IA no se volverá consciente de sí misma, se levantará y aplastará a la humanidad. Un número asombroso de personas parece tener sus pensamientos con respecto a la inteligencia artificial de las películas de ciencia ficción. Deberíamos estar motivados por la ciencia ficción, pero no tan crédulos como para mezclarlos con la realidad. Hay suficientes riesgos reales y presentes para estresarse, desde individuos deliberadamente detestables hasta, sin saberlo, modelos de aprendizaje automático de un solo lado. Así que puedes dejar de preocuparte por SkyNet y la “superinteligencia”.
- Aprendizaje automático significa aprender de los datos; AI es una palabra de moda. El aprendizaje automático satisface la acumulación: hay una gran cantidad de problemas que puede abordar al proporcionar la información de preparación correcta a los cálculos de aprendizaje correctos. Llámelo AI si eso lo alienta a ofrecerlo, pero comprenda que, en cualquier caso, tal como se utiliza fuera del mundo académico, con frecuencia es una expresión de moda que puede significar lo que los individuos necesitan que signifique.
- APRENDIZAJE = REPRESENTACIÓN + EVALUACIÓN + OPTIMIZACIÓN Supongamos que tiene una aplicación para la que cree que puede ser útil el aprendizaje automático. El principal problema al que te enfrentas es la asombrosa variedad de algos de aprendizaje accesibles. ¿Cuál utilizar? Hay verdaderamente miles de accesos, lo que es más, cientos más se distribuyen cada año. La forma de no mezclarse en este espacio gigantesco es comprender que se compone de mezclas de solo tres segmentos.
- Lo que importa es la generalización: el objetivo principal del aprendizaje automático es resumir los casos del conjunto de preparación. Esto se debe a que, independientemente de la cantidad de información que tengamos, es poco probable que veamos esas ilustraciones correctas nuevamente en el momento de la prueba. La combinación más reconocida entre los novatos de aprendizaje automático es probar la información de preparación y tener el engaño del progreso. En el caso de que el clasificador seleccionado se pruebe con nueva información, generalmente no es superior a cualquier especulación irregular. De esta manera, en caso de que contrates a alguien para que construya un clasificador, asegúrate de guardar parte de la información para ti mismo y probar el clasificador que te dan.
- SOLO DATOS NO ES SUFICIENTE La generalización siendo el objetivo tiene otro resultado real: los datos por sí solos no son suficientes, independientemente de la cantidad que tenga.
- EL ALOJAMIENTO SUPERIOR TIENE MUCHAS CONDICIONES: todos en el aprendizaje automático piensan en el sobreajuste, sin embargo, se presentan en muchas estructuras que no son evidentes rápidamente. Un enfoque para comprender el sobreajuste es el deterioro del error de generalización en sesgo y varianza .
- LA INTUICIÓN FALLA EN MEDIDAS ALTAS: Posteriormente al sobreacuerdo, el problema más serio en el aprendizaje automático es el flagelo de la dimensionalidad. Numerosos algoritmos que funcionan bien en mediciones bajas terminan claramente imposibles de manejar en el momento en que la información es de alta dimensión. Sea como sea, en el aprendizaje automático se alude a mucho más. En resumen, los movimientos con precisión se vuelven exponencialmente más difíciles a medida que se desarrolla la dimensionalidad (número de características) de los casos, sobre la base de que un conjunto de preparación de tamaño establecido cubre una división de disminución del espacio de información.
- LAS GARANTÍAS TEÓRICAS NO SON LO QUE APARECEN: los documentos de aprendizaje automático están cargados de certificaciones hipotéticas. El tipo más conocido es un límite en la cantidad de ex-amplas que se espera que garanticen una gran especulación. ¿Qué debes hacer con estas certificaciones? La parte principal de las certificaciones hipotéticas en el aprendizaje automático no es la base para las elecciones prácticas, sino como una fuente de comprensión y un impulso principal para el plan de algoritmos.
- LA INGENIERÍA DE CARACTERÍSTICAS ES LA CLAVE: Hacia el final del día, algunos proyectos de aprendizaje automático tienen éxito y otros se quedan cortos. ¿Qué tiene el efecto? Efectivamente, el factor más vital es lo más destacado utilizado. En el caso de que tengas muchos puntos destacados que cada uno corresponda bien con la clase, el aprendizaje es simple. Por otra parte, si la clase es una capacidad excepcionalmente compleja de los aspectos destacados, es posible que no esté listo para aprenderla. Con frecuencia, los datos en bruto no están en una forma que sea agradable de adaptar, sin embargo, puede desarrollar aspectos destacados a partir de ellos. Esto es comúnmente donde va la gran mayoría del esfuerzo en una empresa de aprendizaje automático. Con frecuencia, también es un destacado entre las partes más fascinantes, donde el instinto, la inventiva y la “artesanía oscura” son tan imprescindibles como el material especializado.
- MÁS DATOS COMPRENDEN A UN ALGORITMO QUE SEA UN CLAVE: suponga que ha creado la mejor disposición de características que puede, sin embargo, los clasificadores que está obteniendo aún no son lo suficientemente exactos. ¿Qué serías capaz de hacer ahora? Hay dos decisiones principales: planificar un algoritmo de aprendizaje superior o reunir más datos . Los científicos del aprendizaje automático están esencialmente preocupados por lo anterior, pero incluso la manera más rápida de progresar es frecuentemente obtener más datos.
- APRENDE MUCHOS MODELOS, NO SIMPLEMENTE UNO: Al comienzo del aprendizaje automático, la mayor parte del esfuerzo consistió en intentar numerosas variaciones y elegir el mejor. En ese punto, los exámenes empíricos precisos demostraron que el mejor alumno difiere de una aplicación a otra, y comenzaron a aparecer los marcos que contenían numerosos alumnos diferentes. El esfuerzo ahora consistía en intentar numerosas variedades de numerosos estudiantes y, hasta el momento, elegir la mejor.
- LA SIMPLICIDAD NO INFIERE A LA EXACTITUD: en el aprendizaje automático, dados dos clasificadores con el mismo error de preparación, el menos complejo de los dos probablemente tendrá el error de prueba más mínimo. Las confirmaciones indicadas de esta reclamación aparecen regularmente en la escritura, sin embargo, en la actualidad hay algunos casos contrarios a la misma, y las hipótesis de “no comer gratis” sugieren que no puede ser válida.
- REPRESENTABLE NO SUGIERE APRENDER Básicamente, todas las representaciones utilizadas en los aprendices de tamaño variable tienen teoremas asociados de la forma “Se puede hablar de cada función, o se puede aproximar de forma discrecional casi, utilizando este retrato”. todos los otros. Sea como sea, el hecho de que se pueda hablar de una capacidad no significa que pueda ser académico.
- LA CONEXIÓN NO IMPLICA LA CAUSACIÓN El objetivo de aprender modelos predictivos es utilizarlos como asesores para la acción. En la remota posibilidad de que encontremos que las bebidas y los bocadillos a menudo se compran juntos en la tienda de comestibles, en ese momento, tal vez poner una bebida junto a la sección de bocadillos incrementará las ofertas. Sin embargo, tímido de hacer el examen es difícil de decir. El aprendizaje automático se aplica generalmente a los datos de observación , donde las variables predictivas no están bajo el control del aprendiz, a diferencia de los datos experimentales , donde están.
- Los algoritmos deben ser implementados antes de ser utilizados.
- El aprendizaje automático es un subconjunto de la IA El aprendizaje automático es una forma práctica de inteligencia artificial, y habla de la ciencia de lograr que las computadoras se inspiren sin ser programadas explícitamente.
- El aprendizaje automático está a nuestro alrededor. Vemos casos cotidianos de aprendizajes automáticos que nos rodean y, por supuesto, subestimamos a menudo: el etiquetado en Facebook, las recomendaciones de productos de Amazon, el sistema de clasificación de páginas de Google o el filtrado automático de spam en Gmail están en el Casos enteros de aprendizaje automático.
- El aprendizaje automático habla con otra cosmovisión en computación En un artículo reciente sobre el tema, Pedro Domingos lo dice de esta manera: “Los algoritmos de aprendizaje automático pueden descubrir cómo realizar tareas importantes al generalizar a partir de ejemplos. Esto es a menudo factible y rentable donde la programación manual no lo es. A medida que se disponga de más datos, se pueden abordar problemas más ambiciosos. Como resultado, el aprendizaje automático es ampliamente utilizado en informática y otros campos “.
- El aprendizaje automático es el centro de la tecnología de “máquinas inteligentes” : las máquinas inteligentes son sistemas que utilizan inteligencia artificial y algoritmos de aprendizaje automático para tomar decisiones y abordar problemas sin intercesión humana. Las máquinas inteligentes se encuentran en las aplicaciones que lo acompañan: dispositivos sensibles al contexto, como teléfonos celulares que detectan su condición física y ajustan su comportamiento en consecuencia; asistentes personales inteligentes como Google Now, Apple Siri;
- El aprendizaje automático perturbará significativamente el destino final de los trabajos : la investigación muestra que numerosos CEOs están subestimando el efecto sistémico y profundo que las máquinas inteligentes tendrán hasta 2020, así como el potencial para que puedan reemplazar millones de empleos de clase media en las décadas a ven.
- El aprendizaje automático creará nuevas oportunidades de aprendizaje : los expertos en TI y negocios deben mantener sus capacidades de empleo pertinentes y actualizadas garantizando que buscan capacidades y diligencias psicológicas que las máquinas no pueden tocar. Esto requerirá progresar en la preparación y mejora de las aptitudes de solicitud más altas, por ejemplo, codificación, estadísticas, visualización, lingüística, gestión de la información y Big Data.
- Sólo se puede aprender el aprendizaje automático mediante la implementación de algoritmos.
El mejor consejo final: cómo aprender el aprendizaje automático en 90 días