La question est assez vague, je vais donc supposer que vous voulez choisir une mesure de performance appropriée pour comparer différents modèles. Pour un bon aperçu des principales différences entre les courbes ROC et PR, vous pouvez vous reporter à l'article suivant: La relation entre le rappel de précision et les courbes ROC par Davis et Goadrich .
Pour citer Davis et Goadrich:
Cependant, lorsqu'il s'agit d'ensembles de données très asymétriques, les courbes de précision-rappel (PR) donnent une image plus informative des performances d'un algorithme.
FPR = FPFP+ TN,TPR = TPTP+ FN.
r e c a l l = TPTP+ FN= TPR ,p r e c i s i o n = TPTP+ FP
FP
Les courbes de rappel de précision sont meilleures pour mettre en évidence les différences entre les modèles pour les ensembles de données fortement déséquilibrés. Si vous souhaitez comparer différents modèles dans des paramètres déséquilibrés, l'aire sous la courbe PR présentera probablement des différences plus importantes que l'aire sous la courbe ROC.
Cela dit, les courbes ROC sont beaucoup plus courantes (même si elles sont moins adaptées). Selon votre public, les courbes ROC peuvent être la lingua franca, donc les utiliser est probablement le choix le plus sûr. Si un modèle domine complètement un autre dans l'espace PR (par exemple, a toujours une plus grande précision sur toute la plage de rappel), il dominera également dans l'espace ROC. Si les courbes se croisent dans l'un ou l'autre espace, elles se croiseront également dans l'autre. En d'autres termes, les principales conclusions seront similaires quelle que soit la courbe que vous utilisez.
Publicité sans vergogne . Comme exemple supplémentaire, vous pourriez jeter un œil à l' un de mes articles dans lequel je rapporte les courbes ROC et PR dans un contexte déséquilibré. La figure 3 contient les courbes ROC et PR pour des modèles identiques, montrant clairement la différence entre les deux. Pour comparer l'aire sous le PR par rapport à l'aire sous ROC, vous pouvez comparer les tableaux 1-2 (AUPR) et les tableaux 3-4 (AUROC) où vous pouvez voir que l'AUPR montre des différences beaucoup plus importantes entre les modèles individuels que l'AUROC. Cela souligne une fois de plus l'adéquation des courbes PR.