Je veux modéliser une régression logistique avec des données déséquilibrées (9: 1). Je voulais essayer l'option de poids dans la glm
fonction dans R, mais je ne suis pas sûr à 100% de ce qu'elle fait.
Disons que ma variable de sortie est c(0,0,0,0,0,0,0,0,0,1)
. maintenant je veux donner au "1" 10 fois plus de poids. donc je donne l'argument des poids weights=c(1,1,1,1,1,1,1,1,1,1,1,10)
.
Lorsque je le ferai, cela sera pris en compte dans le calcul de la probabilité maximale. Ai-je raison? une classification erronée de "1" est seulement 10 fois pire qu'une classification erronée de "0".