Absolutamente. Las técnicas de aprendizaje en línea se pueden usar para seguir mejorando o personalizando una aplicación determinada que utiliza una red basada en LSTM. El aprendizaje en línea permite la actualización de pesos durante la implementación al permitir a los usuarios “señalar / corregir” los resultados incorrectos. La predicción de salida se puede comparar con la salida esperada proporcionada por el usuario y el error se puede volver a anular para actualizar los pesos de los LSTM.
La persona que ha formulado la pregunta debe comprender la distinción entre una secuencia de entrada y una secuencia de entradas. Déjame usar un ejemplo ilustrativo aquí. Considere la posibilidad de utilizar una red LSTM para la traducción de idiomas. Una secuencia de entrada a dicho sistema sería una oración (secuencia de palabras), donde una palabra se envía a la red LSTM a la vez. Ahora, el componente de tiempo en BPTT se refiere a los errores en la predicción realizados en cada paso de tiempo dentro de la secuencia de palabras, una vez que una nueva secuencia de palabras de entrada se envía a la red, el error de la predicción anterior no afecta el error actual. El error actual solo depende de la discrepancia entre la predicción actual y la verdad básica para la secuencia de entrada actual. El error anterior para una secuencia de entrada diferente no se efectúa ni afecta al error actual. La única diferencia en el contexto de la capacitación en línea es que el error se calcula y se distribuye por separado para cada muestra por separado, en lugar de la capacitación fuera de línea donde los lotes se utilizan para calcular el error acumulativo en un cierto número de muestras antes de que el error se vuelva a propagar. Esto es solo para evitar moverse en zigzag en la superficie de la pérdida y no tiene nada que ver con BPTT en LSTM.