Je démarre un projet où la tâche consiste à identifier les types de baskets à partir d'images. Je lis actuellement les implémentations de TensorFlow et Torch . Ma question est: combien d'images par classe sont nécessaires pour atteindre une performance de classification raisonnable?
Existe-t-il des règles générales (ou des règles réelles) concernant la quantité minimale, maximale et "raisonnable" de cellules LSTM que je devrais utiliser? Plus précisément, je me rapporte à BasicLSTMCell de TensorFlow et à la num_unitspropriété. Veuillez supposer que j'ai un problème de classification défini par: t - number of time …
Je prototype une application et j'ai besoin d'un modèle de langage pour calculer la perplexité sur certaines phrases générées. Existe-t-il un modèle de langage formé en python que je peux facilement utiliser? Quelque chose de simple comme model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = …
Comment pourriez-vous optimiser un pré-formé neural network pour l'appliquer à un problème distinct? Souhaitez-vous simplement ajouter plus de couches au modèle pré-formé et le tester sur votre ensemble de données? Par exemple, si la tâche consistait à utiliser un CNN pour classer les groupes de papiers peints , je suis …
Ces deux opérations de convolution sont très courantes dans le deep learning en ce moment. J'ai lu sur la couche convolutionnelle dilatée dans cet article: WAVENET: UN MODÈLE GÉNÉRATIF POUR L'AUDIO BRUT et la déconvolution est dans cet article: Réseaux entièrement convolutifs pour la segmentation sémantique Les deux semblent sur-échantillonner …
J'essaie d'utiliser CNN (réseau neuronal convolutionnel) pour classer les documents. CNN pour les textes / phrases courts a été étudié dans de nombreux articles. Cependant, il semble qu'aucun article n'ait utilisé CNN pour un texte ou un document long. Mon problème est qu'il y a trop de fonctionnalités d'un document. …
J'essaie de comprendre combien de poids et de biais sont nécessaires pour CNN. Disons que j'ai une image (3, 32, 32) et que je souhaite appliquer un filtre (32, 5, 5). Pour chaque carte d'entités, j'ai des poids 5x5, donc je devrais avoir 3 paramètres (5x5) x 32. Maintenant, je …
La plupart des réseaux que j'ai vus ont une ou deux couches denses avant la couche softmax finale. Existe-t-il un moyen de choisir le nombre et la taille des couches denses selon des principes? Deux couches denses sont-elles plus représentatives qu'une, pour le même nombre de paramètres? Le décrochage doit-il …
Je me demande comment interpréter une architecture récurrente dans un contexte EEG. Plus précisément, je pense à cela comme un CNN récurrent (par opposition aux architectures comme LSTM), mais peut-être que cela s'applique également à d'autres types de réseaux récurrents Quand je lis sur les R-CNN, ils sont généralement expliqués …
J'ai lu l' explication de la convolution et je la comprends dans une certaine mesure. Quelqu'un peut-il m'aider à comprendre comment cette opération est liée à la convolution dans les réseaux neuronaux convolutionnels? Le filtre est-il une fonction gqui applique du poids?
J'aimerais pouvoir estimer si un modèle proposé est suffisamment petit pour être formé sur un GPU avec une quantité de mémoire donnée Si j'ai une architecture CNN simple comme celle-ci: Input: 50x50x3 C1: 32 noyaux 3x3, avec rembourrage (je suppose qu'ils sont en réalité 3x3x3 étant donné la profondeur d'entrée?) …
J'ai deux tenseur a:[batch_size, dim] b:[batch_size, dim]. Je veux faire un produit intérieur pour chaque paire du lot, en générant c:[batch_size, 1], où c[i,0]=a[i,:].T*b[i,:]. Comment?
Je travaille à l'analyse des données EEG, qui devront éventuellement être classées. Cependant, obtenir des étiquettes pour les enregistrements coûte quelque peu cher, ce qui m'a amené à envisager des approches non supervisées, afin de mieux utiliser nos quantités assez importantes de données non étiquetées. Cela conduit naturellement à envisager …
J'ai eu une discussion intéressante sur la base d'un projet sur lequel nous travaillions: pourquoi utiliser un système d'inspection visuelle CNN sur un algorithme de correspondance de modèles? Contexte: j'avais montré une démonstration d'un simple système de vision CNN (webcam + ordinateur portable) qui détectait si un type particulier d'objet …
Je travaille actuellement sur la recréation des résultats de cet article . Dans cet article, ils décrivent une méthode d'utilisation de CNN pour l'extraction de caractéristiques et ont un modèle acoustique Dnn-hmm et pré-formé à l'aide de RBM. La sous-section A de la section III indique différentes manières de représenter …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.