Comme la question est toujours sans réponse, voici mon 2ct:
Je pense que deux sujets différents sont mélangés à cette question:
Comment puis-je calculer la sensibilité et la spécificité (ou des mesures analogues) d'un test de diagnostic continu pour prédire un résultat continu (par exemple, la pression artérielle) sans dichotomiser le résultat?
Je suppose que vous souhaitez mesurer les performances du modèle. Le modèle prédit un résultat (métrique) continu à partir d'une sorte d'entrée (il se trouve que c'est également une métrique dans votre exemple, mais cela n'a pas vraiment d'importance ici). Il s'agit d'un scénario de régression, pas d'une classification. Il vaut donc mieux chercher des mesures de performance pour les modèles de régression, la sensibilité et la spécificité ne sont pas ce que vous recherchez *.
Certains problèmes de régression ont un regroupement «naturel» en présence et absence de quelque chose, ce qui donne un lien avec la classification. Pour cela, vous pouvez avoir une distribution bimodale: beaucoup de cas avec absence, et une distribution métrique des valeurs pour les cas de présence. Par exemple, pensez à une substance qui contamine un produit. De nombreux échantillons de produits ne contiendront pas le contaminant, mais pour ceux qui le font, une gamme de concentrations est observée.
Cependant, ce n'est pas le cas pour votre exemple de tension artérielle (l'absence de pression artérielle n'est pas un concept sensé ici). Je suppose même que la pression artérielle est répartie de façon unimodale. Tout cela pointe vers un problème de régression sans lien étroit avec la classification.
* Avec la mise en garde que les deux mots sont utilisés en chimie analytique pour la régression (étalonnage), mais avec un sens différent: là, la sensibilité est la pente de la fonction d'étalonnage / régression, et spécifique signifie parfois que la méthode est complètement sélective , que est-il insensible à d'autres substances que l'analyte, et aucune sensibilité croisée ne se produit.
AD McNaught et A. Wilkinson, éd.: Compendium of Chemical Terminology (le «Livre d'or»). Blackwell Scientific, 1997. ISBN: 0-9678550-9-8. DOI: doi: 10.1351 / livre d'or. URL: http://goldbook.iupac.org/ .
Analogues de sensibilité et de spécificité pour des résultats continus
En revanche, si la nature sous-jacente du problème est une classification, vous pouvez néanmoins vous retrouver à mieux le décrire par une régression:
- la régression décrit un degré d'appartenance aux classes (comme dans les ensembles flous).
- les modèles de régression (postérieur) probabilité de beloning aux classes (comme dans la régression logistique )
- vos cas peuvent être décrits comme des mélanges des classes pures (très proche de la régression "normale", l'exemple de contamination ci-dessus)
Dans ces cas, il est logique d'étendre les concepts de sensibilité et de spécificité aux "classificateurs de résultats continus". L'idée de base est de pondérer chaque cas en fonction de son degré d'appartenance à la classe en question. Pour la sensibilité et la spécificité qui se réfèrent à l'étiquette de référence, pour les valeurs prédictives des appartenances à la classe prédites. Il s'avère que cela conduit à un lien très étroit avec les mesures de performance de type régression.
Nous l'avons récemment décrit dans
C. Beleites, R. Salzer et V. Sergo:
Validation of Soft Classification Models Using Partial Class Memberships: An Extended Concept of Sensitivity & Co. appliqué à Grading of Astrocytoma Tissues
Chemom. Intell. Laboratoire. Syst., 122 (2013), 12 - 22.
Le lien pointe vers la page d'accueil du paquet R mettant en œuvre les mesures de performance proposées.
Encore une fois, l'exemple de la pression artérielle à mon humble avis n'est pas adéquatement décrit comme un problème de classification. Cependant, vous voudrez peut-être toujours lire le document - je pense que la formulation des valeurs de référence indiquera clairement que la pression artérielle n'est pas décrite de manière sensée d'une manière appropriée pour la classification.
(Si vous formulez un degré continu d '«hypertension artérielle» qui serait lui-même un modèle et différent du problème que vous décrivez.)
Je n'ai eu qu'un rapide coup d'œil à l'article que vous avez lié, mais si j'ai bien compris, les auteurs utilisent des seuils (dichotomiser) pour les deux stratégies de modélisation: pour la prédiction continue est davantage traitée: un intervalle de prédiction est calculé et comparé à un certain seuil. Au final, ils ont une prédiction dichotomique et génèrent le ROC en variant la spécification de l'intervalle.
Comme vous spécifiez que vous voulez éviter cela, le document ne semble pas trop pertinent.