Si je comprends bien, un réseau de neurones artificiels perceptron / monocouche avec une fonction d'activation sigmoïde logistique est le même modèle que la régression logistique. Les deux modèles sont donnés par l'équation:
L'algorithme d'apprentissage du perceptron est en ligne et induit par des erreurs, tandis que les paramètres de régression logistique peuvent être appris en utilisant une variété d'algorithmes par lots, y compris la descente de gradient et le BFGS à mémoire limitée, ou un algorithme en ligne, comme la descente de gradient stochastique. Existe-t-il d'autres différences entre la régression logistique et un perceptron sigmoïde? Doit-on s'attendre à ce que les résultats d'un régresseur logistique entraîné avec une descente de gradient stochastique soient similaires à ceux du perceptron?