Je viens de terminer la lecture de cette discussion. Ils soutiennent que PR AUC est meilleure que ROC AUC sur un ensemble de données déséquilibré.
Par exemple, nous avons 10 échantillons dans l'ensemble de données de test. 9 échantillons sont positifs et 1 négatif. Nous avons un modèle terrible qui prédit tout positif. Ainsi, nous aurons une métrique que TP = 9, FP = 1, TN = 0, FN = 0.
Ensuite, Précision = 0,9, Rappel = 1,0. La précision et le rappel sont tous deux très élevés, mais nous avons un mauvais classificateur.
En revanche, TPR = TP / (TP + FN) = 1.0, FPR = FP / (FP + TN) = 1.0. Parce que le FPR est très élevé, nous pouvons identifier que ce n'est pas un bon classificateur.
De toute évidence, ROC est meilleur que PR sur les ensembles de données déséquilibrés. Quelqu'un peut-il expliquer pourquoi les relations publiques sont meilleures?