J'étudie l'architecture du réseau neuronal siamois introduit par Yann LeCun et ses collègues en 1994 pour la reconnaissance des signatures ( "Vérification de signature utilisant un réseau neuronal siamois à retardement" .pdf , NIPS 1994)
J'ai compris l'idée générale de cette architecture, mais je ne comprends vraiment pas comment fonctionne la rétropropagation dans ce cas. Je ne peux pas comprendre quelles sont les valeurs cibles du réseau neuronal, qui permettront à la rétropropagation de définir correctement les poids de chaque neurone.
Dans cette architecture, l'algorithme calcule la similitude en cosinus entre les représentations finales des deux réseaux de neurones. Le papier déclare: "La sortie souhaitée est pour un petit angle entre les sorties des deux sous-réseaux (f1 et f2) lorsque des signatures authentiques sont présentées , et un grand angle si l'une des signatures est un faux ".
Je ne peux pas vraiment comprendre comment ils pourraient utiliser une fonction binaire (similitude cosinus entre deux vecteurs) comme cible pour exécuter la rétropropagation.
Comment la rétropropagation est-elle calculée dans les réseaux neuronaux siamois?