J'essaie de comprendre comment calculer le point de coupure optimal pour une courbe ROC (la valeur à laquelle la sensibilité et la spécificité sont maximisées). J'utilise l'ensemble aSAHde données du package pROC.
La outcomevariable pourrait s'expliquer par deux variables indépendantes: s100bet ndka. En utilisant la syntaxe du Epipackage, j'ai créé deux modèles:
library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)
La sortie est illustrée dans les deux graphiques suivants:

Dans le premier graphique ( s100b), la fonction indique que le point de coupure optimal est localisé à la valeur correspondant à lr.eta=0.304. Dans le deuxième graphique ( ndka), le point de coupure optimal est localisé à la valeur correspondante à lr.eta=0.335(quelle est la signification de lr.eta). Ma première question est:
- quelles sont les valeurs correspondantes
s100betndkaleslr.etavaleurs indiquées (quel est le seuil optimal en termes des100betndka)?
DEUXIÈME QUESTION:
Supposons maintenant que je crée un modèle prenant en compte les deux variables:
ROC(form=outcome~ndka+s100b, data=aSAH)
Le graphique obtenu est:

Je veux savoir quelles sont les valeurs de ndkaET s100bauxquelles la sensibilité et la spécificité sont maximisées par la fonction. En d'autres termes: quelles sont les valeurs de ndkaet s100bpour lesquelles nous avons Se = 68,3% et Sp = 76,4% (valeurs dérivées du graphique)?
Je suppose que cette deuxième question est liée à l'analyse multiROC, mais la documentation du Epipackage n'explique pas comment calculer le point de coupure optimal pour les deux variables utilisées dans le modèle.
Ma question semble très similaire à cette question de reasearchGate , qui dit en bref:
La détermination du score seuil qui représente un meilleur compromis entre la sensibilité et la spécificité d'une mesure est simple. Cependant, pour l'analyse de la courbe ROC multivariée, j'ai noté que la plupart des chercheurs se sont concentrés sur des algorithmes pour déterminer la précision globale d'une combinaison linéaire de plusieurs indicateurs (variables) en termes d'AUC. [...]
Cependant, ces méthodes ne mentionnent pas comment décider d'une combinaison de scores de coupure associés aux multiples indicateurs qui donne la meilleure précision diagnostique.
Une solution possible est celle proposée par Shultz dans son article , mais à partir de cet article, je ne suis pas en mesure de comprendre comment calculer le point de coupure optimal pour une courbe ROC multivariée.
Peut-être que la solution du Epipackage n'est pas idéale, donc tout autre lien utile sera apprécié.