LSTM est l'abréviation de Long Short-Term Memory. Lorsque nous utilisons ce terme la plupart du temps, nous nous référons à un réseau neuronal récurrent ou à un bloc (une partie) d'un réseau plus grand.
Dans ce lien sur la stationnarité et la différenciation , il a été mentionné que les modèles comme ARIMA nécessitent une série chronologique stationnaire pour la prévision car ses propriétés statistiques comme la moyenne, la variance, l'autocorrélation, etc. sont constantes dans le temps. Étant donné que les RNN ont une …
Vais-je suréquiper mon LSTM si je l'entraîne via l'approche à fenêtre coulissante? Pourquoi les gens ne semblent-ils pas l'utiliser pour les LSTM? Pour un exemple simplifié, supposons que nous devons prédire la séquence de caractères: A B C D E F G H I J K L M N O …
J'ai construit un modèle LSTM pour prédire les questions en double sur le jeu de données officiel Quora. Les étiquettes de test sont 0 ou 1. 1 indique que la paire de questions est en double. Après avoir construit le modèle à l'aide model.fit, je teste le modèle à l'aide …
J'ai du mal à interpréter la différence de codage Keras pour un étiquetage de séquence un à plusieurs (par exemple, classification d'images uniques) et plusieurs à plusieurs (par exemple, classification de séquences d'images). Je vois souvent deux types de codes différents: Le type 1 est celui où aucun TimeDistributed appliqué …
Existe-t-il une méthode pour calculer l'intervalle de prédiction (distribution de probabilité) autour d'une série chronologique prévue à partir d'un réseau de neurones LSTM (ou autre récurrent)? Disons, par exemple, que je prédis 10 échantillons dans le futur (t + 1 à t + 10), sur la base des 10 derniers …
J'ai essayé de comprendre comment représenter et façonner les données pour faire une prévision de séries chronologiques multidimentionnelles et multivariées en utilisant Keras (ou TensorFlow) mais je ne suis toujours pas très clair après avoir lu de nombreux articles de blog / tutoriels / documentation sur la façon de présenter …
J'élargis mes connaissances sur le package Keras et j'ai travaillé avec certains des modèles disponibles. J'ai un problème de classification binaire PNL que j'essaie de résoudre et j'ai appliqué différents modèles. Après avoir travaillé avec quelques résultats et lu de plus en plus sur LSTM, il semble que cette approche …
Je prototype une application et j'ai besoin d'un modèle de langage pour calculer la perplexité sur certaines phrases générées. Existe-t-il un modèle de langage formé en python que je peux facilement utiliser? Quelque chose de simple comme model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = …
En utilisant un multicouche LSTMavec dropout, est-il conseillé de mettre le dropout sur tous les calques cachés ainsi que sur les calques Denses en sortie? Dans l'article de Hinton (qui proposait Dropout), il ne plaçait Dropout que sur les couches Denses, mais c'était parce que les couches internes cachées étaient …
Je suis très nouveau dans le Deep Learning et je suis particulièrement intéressé à savoir ce que sont LSTM et BiLSTM et quand les utiliser (principaux domaines d'application). Pourquoi LSTM et BILSTM sont-ils plus populaires que RNN? Pouvons-nous utiliser ces architectures d'apprentissage en profondeur dans des problèmes non supervisés?
J'essaie de construire un système de reconnaissance des gestes pour classer les gestes ASL (American Sign Language) , donc mon entrée est censée être une séquence d'images provenant d'une caméra ou d'un fichier vidéo, puis elle détecte la séquence et la mappe à sa correspondance cours (dormir, aider, manger, courir, …
J'apprends à utiliser Keras et j'ai eu un succès raisonnable avec mon ensemble de données étiqueté en utilisant les exemples de Deep Learning pour Python de Chollet . L'ensemble de données est ~ 1000 séries temporelles de longueur 3125 avec 3 classes potentielles. Je voudrais aller au-delà des couches denses …
Les CNN peuvent avoir des centaines de couches cachées et, comme ils sont souvent utilisés avec des données d'image, le fait d'avoir de nombreuses couches capture plus de complexité. Cependant, pour autant que je l'ai vu, les RNN ont généralement peu de couches, par exemple 2-4. Par exemple, pour la …
Je veux faire des prévisions à un pas pour les séries chronologiques avec LSTM. Pour comprendre l'algorithme, je me suis construit un exemple de jouet: un simple processus autocorrélé. def my_process(n, p, drift=0, displacement=0): x = np.zeros(n) for i in range(1, n): x[i] = drift * i + p * …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.