Je sais que quelque chose me manque dans ma compréhension de la régression logistique et apprécierais vraiment toute aide.
Autant que je sache, la régression logistique suppose que la probabilité d'un résultat '1' compte tenu des entrées est une combinaison linéaire des entrées, passant par une fonction de logistique inverse. Ceci est illustré dans le code R suivant:
#create data:
x1 = rnorm(1000) # some continuous variables
x2 = rnorm(1000)
z = 1 + 2*x1 + 3*x2 # linear combination with a bias
pr = 1/(1+exp(-z)) # pass through an inv-logit function
y = pr > 0.5 # take as '1' if probability > 0.5
#now feed it to glm:
df = data.frame(y=y,x1=x1,x2=x2)
glm =glm( y~x1+x2,data=df,family="binomial")
et j'obtiens le message d'erreur suivant:
Messages d'avertissement: 1: glm.fit: l'algorithme n'a pas convergé 2: glm.fit: probabilités ajustées numériquement égales à 0 ou 1
J'ai travaillé avec R pendant un certain temps maintenant; assez pour savoir que probablement je suis le seul à blâmer .. que se passe-t-il ici?