J'évalue l'efficacité de 5 méthodes différentes pour prédire un résultat binaire particulier (appelez-les «succès» et «échec»). Les données ressemblent à ceci:
Method Sample_Size Success Percent_Success
1 28 4 0.14
2 19 4 0.21
3 24 7 0.29
4 21 13 0.61
5 22 9 0.40
Je voudrais effectuer un test parmi ces 5 méthodes pour évaluer la supériorité relative des méthodes. En d'autres termes, je souhaite classer les méthodes par ordre de performance comme méthode 1> méthode 2> ... méthode 5. Pour éviter le problème des comparaisons multiples, je prévois de faire un test de permutation selon les lignes suivantes:
Étape 1: regrouper toutes les données afin que la taille globale de l'échantillon soit 114 avec 37 succès globaux.
Étape 2: Divisez au hasard les données en 5 groupes avec les tailles d'échantillon correspondantes de 28, 19, 24, 21 et 22.
Étape 3: Incrémentez un compteur si l'ordre observé de Percent_Success de l'étape 2 est cohérent avec l'ordre de mes données.
Étape 4: répétez les étapes 2 et 3 plusieurs fois (disons 10000).
Valeur de p souhaitée = valeur finale du compteur / 10000.
Des questions:
La procédure ci-dessus est-elle correcte?
Y a-t-il quelque chose dans R qui me permettrait d'effectuer le test ci-dessus?
Toutes suggestions d'amélioration ou méthodes alternatives seraient utiles.