Je prévois de faire une étude de simulation où je compare les performances de plusieurs techniques de corrélation robustes avec différentes distributions (asymétriques, avec des valeurs aberrantes, etc.). Par robuste , je veux dire le cas idéal d'être robuste contre a) les distributions asymétriques, b) les valeurs aberrantes et c) les queues lourdes.
Parallèlement à la corrélation de Pearson comme référence, je pensais inclure les mesures plus robustes suivantes:
- Ρ de Spearman
- Corrélation en pourcentage de courbure (Wilcox, 1994, [1])
- Ellipsoïde de volume minimum, déterminant de covariance minimum (
cov.mve
/cov.mcd
avec l'cor=TRUE
option) - Probablement, la corrélation winsorisée
Bien sûr, il existe de nombreuses autres options (surtout si vous incluez également des techniques de régression robustes), mais je veux me limiter aux approches les plus utilisées / les plus prometteuses.
Maintenant, j'ai trois questions (n'hésitez pas à ne répondre qu'à une seule):
- Existe-t-il d'autres méthodes corrélationnelles robustes que je pourrais / devrais inclure?
- Quelles techniques de corrélation robustes sont réellement utilisées dans votre domaine? (Parlant de recherche psychologique: à l'exception de Spearman , je n'ai jamais vu de technique de corrélation robuste en dehors d'un document technique. Le bootstrap devient de plus en plus populaire, mais d'autres statistiques robustes sont plus ou moins inexistantes jusqu'à présent).
- Y a-t-il déjà des comparaisons systématiques de plusieurs techniques de corrélation que vous connaissez?
N'hésitez pas à commenter la liste des méthodes ci-dessus.
[1] Wilcox, RR (1994). Le pourcentage de coefficient de corrélation de courbure. Psychometrika , 59, 601-616.