Pour les questions sur la classification d'image: un problème de décision où un algorithme doit décider à quelle classe ('cat', 'chair', 'tree') appartient une image d'entrée.
J'aimerais utiliser un réseau de neurones pour la classification des images. Je vais commencer par préparer CaffeNet et le former pour mon application. Comment dois-je préparer les images d'entrée? Dans ce cas, toutes les images sont du même objet mais avec des variations (pensez: contrôle de qualité). Ils sont à …
Dans le traitement d'images médicales, la plupart des travaux publiés tentent de réduire le taux de faux positifs (FPR) alors qu'en réalité, les faux négatifs sont plus dangereux que les faux positifs. Quelle est la justification derrière cela?
L'article Aller plus loin avec les circonvolutions décrit GoogleNet qui contient les modules de création d'origine: La modification de la création v2 a consisté à remplacer les convolutions 5x5 par deux convolutions 3x3 successives et à appliquer le pooling: Quelle est la différence entre Inception v2 et Inception v3?
Si je regarde l'une des nombreuses sources des classes Imagenet sur Internet, je ne trouve pas une seule classe liée aux êtres humains (et non, moissonneur n'est pas quelqu'un qui récolte, mais c'est ce que je savais en tant que papa pattes longues, une sorte de Araign? e :-). Comment …
Je veux former un CNN pour la reconnaissance d'image. Les images pour la formation n'ont pas de taille fixe. Je veux que la taille d'entrée pour le CNN soit 50x100 (hauteur x largeur), par exemple. Lorsque je redimensionne des images de petite taille (par exemple 32x32) à la taille d'entrée, …
J'essaie actuellement de comprendre l'architecture d'un CNN. Je comprends la convolution, la couche ReLU, la couche de mise en commun et la couche entièrement connectée. Cependant, je suis toujours confus au sujet des poids. Dans un réseau neuronal normal, chaque neurone a son propre poids. Dans la couche entièrement connectée, …
La plupart des modèles avancés d'apprentissage en profondeur comme VGG, ResNet, etc. nécessitent des images carrées en entrée, généralement avec une taille de pixel de 224x224224x224224x224 . Y a-t-il une raison pour laquelle l'entrée doit être de forme égale, ou puis-je également créer un modèle convnet avec disons 100x200100x200100x200 (si …
Je démarre un projet où la tâche consiste à identifier les types de baskets à partir d'images. Je lis actuellement les implémentations de TensorFlow et Torch . Ma question est: combien d'images par classe sont nécessaires pour atteindre une performance de classification raisonnable?
Existe-t-il des règles générales (ou des règles réelles) concernant la quantité minimale, maximale et "raisonnable" de cellules LSTM que je devrais utiliser? Plus précisément, je me rapporte à BasicLSTMCell de TensorFlow et à la num_unitspropriété. Veuillez supposer que j'ai un problème de classification défini par: t - number of time …
Je prototype une application et j'ai besoin d'un modèle de langage pour calculer la perplexité sur certaines phrases générées. Existe-t-il un modèle de langage formé en python que je peux facilement utiliser? Quelque chose de simple comme model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = …
Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un seul problème en modifiant ce post . Fermé il y a 4 ans . Je travaille sur un projet et …
J'ai eu une discussion intéressante sur la base d'un projet sur lequel nous travaillions: pourquoi utiliser un système d'inspection visuelle CNN sur un algorithme de correspondance de modèles? Contexte: j'avais montré une démonstration d'un simple système de vision CNN (webcam + ordinateur portable) qui détectait si un type particulier d'objet …
J'ai formé un réseau convolutionnel pour classer les images d'un composant mécanique comme bonnes ou défectueuses. Bien que la précision du test soit élevée, j'ai réalisé que le modèle fonctionnait mal sur des images qui avaient un éclairage légèrement différent. Les fonctionnalités que j'essaie de détecter sont subtiles, et l'éclairage …
La classification des images consiste à attribuer l'un desnnnétiquettes précédemment connues pour une image donnée. Par exemple, vous savez que vous recevrez quelques photos et chaque image a exactement l'une des{ c a t , do g, c a r , s t o n e }{cat,dog,car,stone}\{cat, dog, car, stone\}en …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.