Oui, vous pouvez équiper des modèles de régression logistique. Mais d'abord, je voudrais aborder le point concernant l'AUC (zone sous la courbe caractéristique de fonctionnement du récepteur): il n'y a jamais de règles générales universelles avec l'AUC, jamais jamais.
L'AUC est la probabilité qu'un positif (ou un cas) échantillonné de manière aléatoire ait une valeur de marqueur plus élevée qu'un négatif (ou un contrôle) parce que l'ASC est mathématiquement équivalente à la statistique U.
Ce que l'AUC n'est pas, c'est une mesure normalisée de la précision prédictive. Les événements hautement déterministes peuvent avoir des AUC à prédicteur unique de 95% ou plus (comme dans la mécatronique contrôlée, la robotique ou l'optique), certains modèles complexes de prédiction du risque logistique multivariable ont des AUC de 64% ou moins comme la prédiction du risque de cancer du sein, et ceux-ci sont niveaux de précision prédictive relativement élevés.
Une valeur AUC sensible, comme pour une analyse de puissance, est prédéfinie en rassemblant des connaissances sur le contexte et les objectifs d'une étude a priori . Le médecin / ingénieur décrit ce qu'ils veulent et vous, le statisticien, décidez d'une valeur AUC cible pour votre modèle prédictif. Puis commence l'enquête.
Il est en effet possible d'ajuster un modèle de régression logistique. Mis à part la dépendance linéaire (si la matrice du modèle est de rang déficient), vous pouvez également avoir une concordance parfaite, ou le tracé des valeurs ajustées par rapport à Y discrimine parfaitement les cas et les contrôles. Dans ce cas, vos paramètres n'ont pas convergé mais résident simplement quelque part sur l'espace limite qui donne une probabilité de . Parfois, cependant, l'ASC est de 1 par hasard au hasard.∞
2βp≫nπ(1−π)π=Prob(Y=1)p