Las diferencias clave pueden ilustrarse a través de un problema de ejemplo de la interpretación de la placa de matrícula del vehículo:
- Procesamiento de imágenes convencional: un experto en dominios analizará las imágenes, identificará un conjunto de filtros, transformaciones y pasos de procesamiento previo que serían los mejores para identificar de forma única cada dígito. Se diseñaría un algoritmo (serie de tales transformaciones) que haría un buen trabajo de identificación de un dígito dado una placa de número que se adhiere a un formato fijo. Esencialmente, codificar el proceso de pensamiento humano en un algoritmo de visión de computadora.
- Aprendizaje automático: obtendría un conjunto de entrenamiento (cien mil imágenes, tal vez) de matrículas. Convierte todas las imágenes en vectores de características y entrena un modelo. Este modelo podría elegirse desde un conjunto de algoritmos que caen bajo ‘ML’: SVM (máquina de vectores de soporte) hasta una red neuronal de 3 capas con un clasificador de softmax. No hay una manera clara de identificar qué algoritmo usar.
- Aprendizaje profundo: es esencialmente una red neuronal con múltiples capas (generalmente más de 3) que requeriría un conjunto de datos de imágenes bastante sólido para hacer predicciones muy precisas. Los modelos de aprendizaje profundo de redes neuronales convolucionales (CNN) han demostrado obtener muy buenos resultados. El lado positivo es que este enfoque proporciona una arquitectura única para resolver tales problemas. Sin embargo, requeriría máquinas más poderosas que una simple red neuronal de 3 capas.
El aprendizaje profundo da muy buenos resultados para problemas en los que existen conjuntos de datos suficientemente grandes. El procesamiento de imágenes convencional aún sería necesario en los casos en que el conjunto de datos de la imagen no sea lo suficientemente amplio.
Gran parte de esta respuesta se inspiró en este blog que hace un gran trabajo explicando las diferencias. Si está interesado en comenzar con ML y el aprendizaje profundo, sugiero que realice el curso de Andrew NG en ML en courseera y luego cs231n.
- Tengo 17 años y terminé la escuela secundaria el año pasado. Pasé los últimos 7 meses viajando y ahora tengo tres meses de tiempo libre. ¿Cuál es la habilidad más útil que puedo desarrollar en 3 meses?
- ¿Qué puedo hacer / aprender en mis 20 años para salir adelante?
- ¿Cuáles son las 10 cosas más importantes que aprender en la programación HTML?
- ¿Cómo es que nunca aprendo lecciones de los errores?
- Cómo continuar aprendiendo y mejorando si se ha convertido en la persona más talentosa que conoce