La vision par ordinateur est un sous-domaine de l'informatique qui traite de l'analyse et de la compréhension des images. Cela inclut la détection d'objets tels que les visages dans les images ou la segmentation des images.
Comment calculer la mAP (moyenne moyenne de précision) pour la tâche de détection pour les classements Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Il a dit - à la page 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Précision moyenne (AP). Pour le défi VOC2007, la précision moyenne interpolée (Salton et Mcgill 1986) a été utilisée pour évaluer à …
L'article Aller plus loin avec les circonvolutions décrit GoogleNet qui contient les modules de création d'origine: La modification de la création v2 a consisté à remplacer les convolutions 5x5 par deux convolutions 3x3 successives et à appliquer le pooling: Quelle est la différence entre Inception v2 et Inception v3?
Pour la détection, une façon courante de déterminer si une proposition d'objet était correcte est Intersection over Union (IoU, IU). Cela prend l'ensemble AUNEA des pixels d'objet proposés et l'ensemble des pixels d'objet réels BBB et calcule: IoU(A,B)=A∩BA∪BIoU(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A \cup B} Généralement, IoU> 0,5 signifie que …
Si l'on regarde 90 à 99% des articles publiés à l'aide d'un CNN (ConvNet). La grande majorité d'entre eux utilise une taille de filtre de nombres impairs : {1, 3, 5, 7} pour les plus utilisés. Cette situation peut entraîner un problème: avec ces tailles de filtre, généralement l'opération de …
Je prototype une application et j'ai besoin d'un modèle de langage pour calculer la perplexité sur certaines phrases générées. Existe-t-il un modèle de langage formé en python que je peux facilement utiliser? Quelque chose de simple comme model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = …
Ces deux opérations de convolution sont très courantes dans le deep learning en ce moment. J'ai lu sur la couche convolutionnelle dilatée dans cet article: WAVENET: UN MODÈLE GÉNÉRATIF POUR L'AUDIO BRUT et la déconvolution est dans cet article: Réseaux entièrement convolutifs pour la segmentation sémantique Les deux semblent sur-échantillonner …
J'essaie de mettre en œuvre un algorithme où étant donné une image avec plusieurs objets sur une table plane, souhaitée est la sortie de masques de segmentation pour chaque objet. Contrairement aux CNN, l'objectif ici est de détecter des objets dans un environnement inconnu. Quelles sont les meilleures approches à …
Je voudrais vérifier les fichiers JPG s'ils ont été manipulés pour changer le contenu. Ce que je considère PAS photoshoppé: Recadrage Tournant (Mise à l'échelle) Résolution de l'image Modifications automatiques que les smartphones peuvent apporter Ce que je considère comme le photoshopping: Ajout d'une nouvelle image au-dessus de parties de …
Dans cet article très cité , les auteurs donnent la discussion suivante sur le nombre de paramètres de poids. Je ne sais pas très bien pourquoi il a des paramètres . Je pense que ce devrait être car chacun des canaux d'entrée partage le même filtre, qui a paramètres. 49 …
Y a-t-il des articles publiés qui montrent des différences dans les méthodes de régularisation pour les réseaux de neurones, de préférence sur différents domaines (ou au moins différents ensembles de données)? Je pose la question parce que j'ai actuellement le sentiment que la plupart des gens semblent n'utiliser que le …
Je veux extraire des paramètres d'une image à l'aide d'un réseau neuronal. Exemple: Étant donné l'image d'un mur de briques, le NN devrait extraire la largeur et la hauteur des briques, la couleur et la rugosité. Je peux générer des images pour des paramètres donnés pour entraîner le NN et …
J'utilise un descripteur HOG, couplé à un classificateur SVM, pour reconnaître les humains dans les images. J'utilise les wrappers Python pour OpenCV. J'ai utilisé l'excellent tutoriel de pymagesearch , qui explique ce que fait l'algorithme et fournit des conseils sur la façon de définir les paramètres de la méthode detectMultiScale …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.