J'ai quelques ensembles de données EEG que je teste contre deux classes. Je peux obtenir un taux d'erreur décent de LDA (les distributions conditionnelles de classe ne sont pas gaussiennes, mais ont des queues similaires et une séparation suffisamment bonne), et donc je veux tracer le ROC du prédicteur LDA par rapport aux ensembles de données d'autres sujets.
Voici un graphique typique du prédicteur testé par rapport à un seul essai:
J'ai essayé quelques packages différents (pROC et ROCR), et les résultats sont cohérents. Ma question est, qu'est-ce que le coude pointu? Est-ce juste un artefact de la projection produite par le LDA, c'est-à-dire qu'il se trouve qu'il y a une «falaise» où les performances du classificateur s'effondrent?