J'ai un modèle de régression logistique formé que j'applique à un ensemble de données de test. La variable dépendante est binaire (booléenne). Pour chaque échantillon de l'ensemble de données de test, j'applique le modèle de régression logistique pour générer un% de probabilité que la variable dépendante soit vraie. Ensuite, j'enregistre si la valeur réelle était vraie ou fausse. Je suis en train de calculer un ou ajusté figure comme dans un modèle de régression linéaire.R 2
Cela me donne un enregistrement pour chaque échantillon dans l'ensemble de test comme:
prob_value_is_true acutal_value
.34 0
.45 1
.11 0
.84 0
.... ....
Je me demande comment tester la précision du modèle. Ma première tentative a été d'utiliser un tableau de contingence et de dire "si prob_value_is_true
> 0,80, devinez que la valeur réelle est vraie", puis de mesurer le rapport des classifications correctes aux incorrectes. Mais je n'aime pas ça, parce que j'ai l'impression que j'évalue simplement le 0.80 comme une limite, pas la précision du modèle dans son ensemble et à toutes les prob_value_is_true
valeurs.
Ensuite, j'ai essayé de regarder chaque valeur discrète prob_value_is_true, à titre d'exemple, en regardant tous les échantillons où prob_value_is_true
= 0,34 et en mesurant le% de ces échantillons où la valeur réelle est vraie (dans ce cas, une précision parfaite serait si le% des échantillons c'était vrai = 34%). Je pourrais créer un score de précision du modèle en additionnant la différence à chaque valeur discrète de prob_value_is_true
. Mais la taille des échantillons est une énorme préoccupation ici, en particulier pour les extrêmes (proches de 0% ou 100%), de sorte que les moyennes des valeurs aiguës ne sont pas précises, donc les utiliser pour mesurer la précision du modèle ne semble pas correct.
J'ai même essayé de créer d'énormes plages pour garantir des tailles d'échantillon suffisantes (0-.25, .25-.50, .50-.75, .75-1.0), mais comment mesurer la «qualité» de ce% de la valeur réelle me décourage . Supposons que tous les échantillons dont la valeur se prob_value_is_true
situe entre 0,25 et 0,50 ont une moyenne acutal_value
de 0,45. Est-ce bien puisque c'est dans la gamme? Mauvais puisque ce n'est pas près de 37,5% (le centre de la gamme)?
Je suis donc coincé à ce qui semble être une question facile, et j'espère que quelqu'un pourra me diriger vers une ressource ou une méthode pour calculer une précision stastique pour un modèle de régression logistique.