Je voudrais proposer ma méthode et j'espère qu'elle vous aidera.
Pour calculer les coefficients manuellement, vous devez avoir certaines données, ou dire des contraintes. Dans la régression logistique, c'est en fait la façon dont la fonction logistique est définie via les multiplicateurs d'entropie et de décalage maximum, cette contrainte doit être rencontrée avec deux autres: . Autrement dit, l'attente du modèle devrait correspondre à l'attente observée , qui a été illustrée dans cet article . C'est pourquoi la fonction logit en tant que fonction de lien dans la régression logistique est également appelée fonction moyenne.Epfj=Ep^fj
Prenez par exemple, le tableau ci-dessous montre combien d'hommes / femmes sont dans la classe d'honneur.
| female
hon | male female | Total
-----------+----------------------+----------
0 | 74 77 | 151
1 | 17 32 | 49
-----------+----------------------+----------
Total | 91 109 | 200
Comme mentionné ci-dessus, est valable. Le côté gauche (LHS) est l'attente des observations (y dans l'échantillon) et le côté droit (RHS) est l'attente du modèle.∑iyixij=∑ipixij
En supposant que la fonction est ou de manière équivalente ( représente la caractéristique de l'observation étant une femelle, c'est 1 si l'observation est une femelle et 0 sinon), on sait évidemment que les deux équations suivantes sont valables respectivement lorsque et lorsque avec les données indiquées ci-dessus: log(p1−p)=β0+β1xip=11+e−(β0+β1∗xi)xiX=1X=0
32109=11+e−(β0+β1∗1)
1791=11+e−(β0+β1∗0)
L'ordonnée à l'origine ( ) est donc de -1,47 et le coefficient ( ) est de 0,593. Vous pouvez l'obtenir manuellement.β0β1
Dans le même ordre d'idées, vous pouvez calculer manuellement les coefficients d'autres modèles de régression logistique (cela s'applique également à la régression softmax mais cela sort du cadre de cette question) si suffisamment de données sont fournies.
J'espère avoir raison, sinon faites-le moi savoir. Merci.