Cette question concerne l'estimation des scores de coupure sur un questionnaire de dépistage multidimensionnel pour prédire un critère d'évaluation binaire, en présence d'échelles corrélées.
On m'a interrogé sur l'intérêt de contrôler les sous-scores associés lors de l'élaboration des scores de coupure sur chaque dimension d'une échelle de mesure (traits de personnalité) qui pourraient être utilisés pour le dépistage de l'alcoolisme. Autrement dit, dans ce cas particulier, la personne n'était pas intéressée à ajuster sur les covariables externes (prédicteurs) - ce qui conduit à une aire (partielle) sous la courbe ROC ajustée sur les covariables, par exemple (1-2) - mais essentiellement sur d'autres scores du même questionnaire car ils sont en corrélation les uns avec les autres (par exemple "impulsivité" avec "recherche de sensations"). Cela revient à construire un GLM qui inclut à gauche le score d'intérêt (pour lequel nous recherchons un seuil) et un autre score calculé à partir du même questionnaire, tandis qu'à droite le résultat peut être le statut de consommation d'alcool.
Pour clarifier (par demande @robin), supposons que nous ayons scores, disons (par exemple, anxiété, impulsivité, névrosisme, recherche de sensations), et nous voulons trouver une valeur de coupure (c'est-à-dire "cas positif" si , "cas négatif" sinon) pour chacun d'eux. Nous ajustons généralement pour d'autres facteurs de risque comme le sexe ou l'âge lors de l'élaboration de ce seuil (en utilisant l'analyse de la courbe ROC). Maintenant, qu'en est-il de l'ajustement de l'impulsivité (IMP) sur le sexe, l'âge et la recherche de sensations (SS) étant donné que SS est corrélé avec IMP? En d'autres termes, nous aurions une valeur seuil pour la PMI lorsque l'effet de l'âge, du sexe et du niveau d'anxiété est supprimé.
En plus de dire qu’une coupure doit rester aussi simple que possible, ma réponse a été
Concernant les covariables, je recommanderais d'estimer les ASC avec et sans ajustement, juste pour voir si la performance prédictive augmente. Ici, vos covariables ne sont que d'autres sous-scores définis à partir du même instrument de mesure et je n'ai jamais été confronté à une telle situation (généralement, je m'ajuste sur des facteurs de risque connus, comme l'âge ou le sexe). [...] De plus, étant donné que vous vous intéressez aux questions pronostiques (c.-à-d. L'efficacité du dépistage du questionnaire), vous pouvez également être intéressé à estimer la valeur prédictive positive (PPV, probabilité de patients avec des résultats de test positifs qui sont correctement classés) à condition vous pouvez classer les sujets comme "positifs" ou "négatifs" en fonction de leurs sous-scores sur votre questionnaire. Notez cependant
Avez-vous une compréhension plus approfondie de cette situation particulière, avec un lien vers les documents pertinents lorsque cela est possible?
Les références
- Janes, H et Pepe, MS (2008). Ajustement pour les covariables dans les études des marqueurs diagnostiques, de dépistage ou pronostiques: un vieux concept dans un nouveau contexte . American Journal of Epidemiology , 168 (1): 89-97.
- Janes, H et Pepe, MS (2008). Prise en compte des covariables dans l'analyse ROC . UW Biostatistics Working Paper Series , Paper 322.