nombre de paramètres pour les couches de convolution


9

Dans cet article très cité , les auteurs donnent la discussion suivante sur le nombre de paramètres de poids. Je ne sais pas très bien pourquoi il a des paramètres . Je pense que ce devrait être car chacun des canaux d'entrée partage le même filtre, qui a paramètres. 49 C C 4949C249CC49

entrez la description de l'image ici


1
L'utilisation d'une image ici réduit la qualité de la question car elle ne peut pas être recherchée. Veuillez plutôt utiliser du texte.
Neil Slater

Réponses:


17

En fait, c'est , le premier est le nombre de canaux d'entrée et le second est le nombre de filtres.C C49CCCC

Citation de CS231n :

Pour résumer, la couche Conv:

  • Accepte un volume de tailleW1×H1×D1
  • Nécessite quatre hyperparamètres:
    • Nombre de filtres ,K
    • leur étendue spatiale ,F
    • la foulée ,S
    • la quantité de remplissage de zéros .P
  • Produit un volume de taille où: W2×H2×D2
    • W2=(W1F+2P)/S+1
    • H2=(H1F+2P)/S+1 (c'est-à-dire que la largeur et la hauteur sont calculées également par symétrie)
    • D2=K
  • Avec le partage de paramètres, il introduit poids par filtre, pour un total de poids et biais. ( F F D 1 ) K KFFD1(FFD1)KK
  • Dans le volume de sortie, la tranche de profondeur -ième (de taille ) est le résultat de l' exécution d' une convolution valide du filtre -ième sur le volume d'entrée avec un pas de , puis neutralisées par -ième biais.L 2 × H 2 d S ddW2×H2dSd

Un paramètre commun des hyperparamètres est . Cependant, il existe des conventions et des règles générales communes qui motivent ces hyperparamètres. Voir la section Architectures ConvNet ci-dessous.F=3,S=1,P=1


Salut Icyblade, merci pour la réponse. Cependant, ma question est toujours liée à la déclaration "avec le partage de paramètres, il introduit des poids FFD1 par filtre". Nous savons que chaque filtre a deux connexions aux canaux d'entrée D1, donc selon cette déclaration, le poids reliant ce filtre est différent entre différents canaux d'entrée, n'est-ce pas?
user297850

Les valeurs de ces poids sont différentes, mais les nombres sont les mêmes.
Icyblade

L'utilisation d'une pâte d'image ici réduit la qualité de la réponse car elle ne peut pas être recherchée. Veuillez plutôt utiliser du texte. Cependant, je suis d'accord avec la réponse - elle me semble correcte.
Neil Slater

@ user297850: Veuillez ne pas étendre votre question - posez-en une nouvelle si vous avez toujours des problèmes.
Neil Slater

@NeilSlater Merci pour votre conseil, il me faut du temps pour reformater.
Icyblade
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.