Supposons que je veuille faire une classification binaire (quelque chose appartient à la classe A ou à la classe B). Il existe certaines possibilités pour ce faire dans la couche de sortie d'un réseau de neurones:
Utilisez 1 nœud de sortie. La sortie 0 (<0,5) est considérée comme classe A et 1 (> = 0,5) est considérée comme classe B (en cas de sigmoïde)
Utilisez 2 nœuds de sortie. L'entrée appartient à la classe du nœud avec la valeur / probabilité la plus élevée (argmax).
Y a-t-il des articles écrits qui en discutent (également)? Quels sont les mots clés spécifiques à rechercher?
Cette question est déjà posée auparavant sur ce site par exemple voir ce lien sans vraies réponses. Je dois faire un choix (mémoire de maîtrise), donc je veux avoir un aperçu des avantages / inconvénients / limites de chaque solution.