Une régression logistique maximisant la vraisemblance maximise-t-elle aussi nécessairement l'ASC par rapport aux modèles linéaires?

Étant donné un ensemble de données avec des résultats binaires $y\in\{0,1\}^n$ et une matrice prédictive $X\in\mathbb{R}^{n\times p}$ , le modèle de régression logistique standard estime les coefficients $\beta_{MLE}$ qui maximisent la vraisemblance binomiale. Lorsque $X$ est de rang complet $\beta_{MLE}$ est unique; lorsque la séparation parfaite n'est pas présente, elle est finie.

Ce modèle de maximum de vraisemblance maximise-t-il également l'ASC ROC (aka $c$ -statistique), ou existe-t-il une estimation de coefficient $\beta_{AUC} \neq \beta_{MLE}$ qui permettra d'obtenir une AUC ROC plus élevée? S'il est vrai que le MLE ne maximise pas nécessairement l'AUC ROC, alors une autre façon de considérer cette question est "Y a-t-il une alternative à la maximisation de vraisemblance qui maximisera toujours l'AUC ROC d'une régression logistique?"

Je suppose que les modèles sont par ailleurs les mêmes: nous n'ajoutons ni ne supprimons de prédicteurs dans $X$ , ni ne modifions autrement la spécification du modèle, et je suppose que les modèles de maximisation de vraisemblance et de maximisation d'AUC utilisent la même fonction de lien.

logistic maximum-likelihood auc

— Sycorax dit de réintégrer Monica
source

Sûrement

si, par exemple, une fonction de lien génère un meilleur ajustement qu'un logit? Autre que cela, bonne question, si le processus de génération de données peut être supposé comme logit.

β_{AUC} \neq β_{MLE}

$\beta_{\text{AUC}} \neq \beta_{\text{MLE}}$

— Nutle

Bonne question mais réfléchissez. ROC et AUC sont utilisés pour comparer deux modèles différents, donc si une solution pour l'estimation MLE d'un modèle est unique, cela signifie que vous ne pouvez obtenir une AUC différente que si vous modifiez les spécifications du modèle actuel et que vous estimez une nouvelle différence modèle via MLE. Donc, à ce stade, une autre question serait: existe-t-il une autre "meilleure" méthode d'estimation (algorithme de maximisation ecc) autre que le MLE simple applicable au même modèle de telle sorte que j'arrive à différentes estimations des coefficients conduisant à de nouveaux "meilleurs" bêtas avec une ASC plus élevée?

— Fr1

@Nutle exactement, ce serait une spécification différente

— Fr1

@ Fr1 Oui, c'est ce que signifie unique. Ce que j'implique dans ma question est quelque chose comme "et s'il y a une alternative au MLE qui atteint une ASC plus élevée?" S'il est vrai qu'il existe un modèle linéaire différent (un modèle autre que le MLE) qui atteint une ASC plus élevée, alors ce serait intéressant à connaître.

— Sycorax dit Réintégrer Monica

@Sycorax que supposons-nous d'autre? :) Les hypothèses sont importantes, car si nous connaissons le vrai DGP avec le lien et les variables utilisés, le MLE est la statistique impartiale la plus puissante.

— Nutle

Ce n'est pas le cas que $\beta_{MLE} = \beta_{AUC}$ .

Pour illustrer cela, considérons que l'AUC peut s'écrire

$P(\hat y_1 > \hat y_0 | y_1 = 1, y_0 = 0)$

En d'autres termes, l'ordre des prédictions est la seule chose qui affecte l'AUC . Ce n'est pas le cas avec la fonction de vraisemblance. Donc, en tant qu'exercice mental, supposons que nous avions un seul prédicteur et dans notre ensemble de données, nous ne voyons pas de séparation parfaite (c'est-à-dire, $\beta_{MLE}$ est fini). Maintenant, si nous prenons simplement la valeur du plus grand prédicteur et l'augmentons d'une petite quantité, nous changerons la probabilité de cette solution, mais cela ne changera pas l'AUC, car l'ordre devrait rester le même. Ainsi, si l'ancien MLE maximisait l'ASC, il maximisera toujours l'ASC après avoir changé le prédicteur, mais ne maximisera plus la probabilité.

Ainsi, à tout le moins, il n'est pas vrai que $\beta_{AUC}$ n'est pas unique; tout $\beta$ qui conserve l'ordre des estimations obtient exactement la même ASC. En général, comme l'AUC est sensible à différents aspects des données, je pense que nous devrions pouvoir trouver un cas où $\beta_{MLE}$ ne maximise pas $\beta_{AUC}$ . En fait, je suppose que cela se produit avec une forte probabilité.

ÉDITER (déplacer le commentaire en réponse)

L'étape suivante consiste à prouver que le MLE ne maximise pas nécessairement l'AUC (ce qui n'est pas encore prouvé). On peut le faire en prenant quelque chose comme les prédicteurs 1, 2, 3, 4, 5, 6, $x$ (avec $x > 6$ ) avec les résultats 0, 0, 0, 1, 1, 1, 0. Toute valeur positive de $\beta$ sera maximiser l'ASC (quelle que soit la valeur de $x$ ), mais nous pouvons choisir un $x$ suffisamment grand pour que le $\beta_{MLE} < 0$ .

— Cliff AB
source

(+1) Ah! Bien sûr - puisqu'il s'agit de la commande, nous pourrions changer arbitrairement l'ordonnée à l'origine qui doit évidemment changer la valeur de vraisemblance, mais la commande doit être la même car aucun des coefficients de caractéristique n'a changé, donc l'ASC restera fixe.

— Sycorax dit Réintégrer Monica

+1. Est-ce que l' exemple d' édition fonctionne avec

, cependant? Si nous devons prendre suffisamment grand

pour que cela fonctionne avec un grand

, la probabilité de telles valeurs existantes ne converge-t-elle pas rapidement vers 0, pour certains logit fixes?

n \to \infty

$n \rightarrow \infty$

x

$x$

n

$n$

— Nutle

@Nutle: eh bien, cela dépend de ce que vous voulez dire à propos de

. Si nous prenions

copies (prédicteurs + résultats) de mon jeu de données de jouets, alors oui, le résultat tiendrait. Cependant, si nous prenions

copies de cet ensemble de prédicteurs et que les données provenaient vraiment d'un modèle de régression logistique, cela ne se produirait presque jamais (comme vous le signalez). Notez, cependant, que quelque chose de semblable pourrait se produire avec une forte probabilité si la relation entre les prédicteurs ne suivait pas vraiment un modèle de régression logistique.

n \to \infty

$n \rightarrow \infty$

n

$n$

n

$n$

— Cliff AB

x

$x$

n

$n$