J'ai récemment lu des réseaux entièrement convolutionnels pour la segmentation sémantique par Jonathan Long, Evan Shelhamer et Trevor Darrell. Je ne comprends pas ce que font les "couches déconvolutionnelles" / comment elles fonctionnent. La partie pertinente est 3.3. L'échantillonnage est une convolution à pas en arrière L'interpolation est un autre …
J'ai récemment lu les commentaires de Yan LeCuns sur 1x1 convolutions : Dans les réseaux convolutionnels, il n’existe pas de "couches entièrement connectées". Il existe uniquement des couches de convolution avec des noyaux de convolution 1x1 et une table de connexion complète. C'est un fait trop rarement compris que ConvNets …
J'aimerais utiliser un réseau de neurones pour la classification des images. Je vais commencer par préparer CaffeNet et le former pour mon application. Comment dois-je préparer les images d'entrée? Dans ce cas, toutes les images sont du même objet mais avec des variations (pensez: contrôle de qualité). Ils sont à …
Cette question se résume à "comment fonctionnent exactement les couches de convolution . Supposons que j'ai une image en niveaux de gris . L'image a donc un canal. Dans la première couche, j'applique une convolution avec des filtres et un remplissage. Ensuite, j'ai une autre couche de convolution avec convolutions …
J'ai souvent entendu des gens dire que les raisons pour lesquelles les réseaux de neurones convolutionnels sont encore mal compris. Est-il connu que les réseaux de neurones convolutifs finissent toujours par apprendre des fonctionnalités de plus en plus sophistiquées au fur et à mesure que nous remontons les couches? Qu'est-ce …
Lors de la formation de réseaux de neurones, un hyperparamètre est de la taille d'un mini-lot. Les choix courants sont 32, 64 et 128 éléments par mini-lot. Existe-t-il des règles / directives sur la taille d'un mini-lot? Des publications qui étudient l'effet sur la formation?
L'article Aller plus loin avec les circonvolutions décrit GoogleNet qui contient les modules de création d'origine: La modification de la création v2 a consisté à remplacer les convolutions 5x5 par deux convolutions 3x3 successives et à appliquer le pooling: Quelle est la différence entre Inception v2 et Inception v3?
Je suis assez nouveau dans les réseaux de neurones, mais je comprends assez bien l'algèbre linéaire et les mathématiques de la convolution. J'essaie de comprendre l'exemple de code que je trouve à divers endroits sur le net pour former un NN convolutionnel Keras avec des données MNIST pour reconnaître les …
Je joue un peu avec des convnets. Plus précisément, j'utilise l'ensemble de données kaggle cats-vs-dogs qui consiste en 25000 images étiquetées comme chat ou chien (12500 chacune). J'ai réussi à atteindre une précision de classification d'environ 85% sur mon test, mais je me suis fixé comme objectif d'atteindre une précision …
Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen …
J'ai le CNN suivant: Je commence par une image d'entrée de taille 5x5 Ensuite, j'applique la convolution en utilisant un noyau 2x2 et stride = 1, ce qui produit une carte de caractéristiques de taille 4x4. Ensuite, j'applique un pool max 2x2 avec stride = 2, ce qui réduit la …
Si je regarde l'une des nombreuses sources des classes Imagenet sur Internet, je ne trouve pas une seule classe liée aux êtres humains (et non, moissonneur n'est pas quelqu'un qui récolte, mais c'est ce que je savais en tant que papa pattes longues, une sorte de Araign? e :-). Comment …
J'ai une petite sous-question à cette question . Je comprends que lors d'une rétropropagation à travers une couche de mise en commun maximale, le gradient est réacheminé de manière à ce que le neurone de la couche précédente qui a été sélectionné comme max reçoive tout le gradient. Ce dont …
J'essaie de comprendre cet article et je ne suis pas sûr de ce qu'est le suréchantillonnage bi-linéaire. Quelqu'un peut-il expliquer cela à un niveau élevé? https://arxiv.org/abs/1606.00915
Si l'on regarde 90 à 99% des articles publiés à l'aide d'un CNN (ConvNet). La grande majorité d'entre eux utilise une taille de filtre de nombres impairs : {1, 3, 5, 7} pour les plus utilisés. Cette situation peut entraîner un problème: avec ces tailles de filtre, généralement l'opération de …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.