Attention: c'est une excellente question et je ne connais pas la réponse, c'est donc plutôt "ce que je ferais si je devais":
Dans ce problème, il existe de nombreux degrés de liberté et de nombreuses comparaisons, mais avec des données limitées, il s'agit vraiment d'agréger efficacement les données. Si vous ne savez pas quel test exécuter, vous pouvez toujours "en inventer" un en utilisant des permutations:
Nous définissons d'abord deux fonctions:
Fonction de vote : comment marquer les classements afin de pouvoir combiner tous les classements d'un même groupe. Par exemple, vous pouvez attribuer 1 point à l'élément le mieux classé et 0 à tous les autres. Cependant, vous perdriez beaucoup d'informations, alors il vaut peut-être mieux utiliser quelque chose comme: l'élément le mieux classé obtient 1 point, le deuxième 2 points, etc.
Fonction de comparaison : comment comparer deux scores agrégés entre deux groupes. Puisque les deux seront un vecteur, prendre une norme appropriée de la différence fonctionnerait.
Procédez maintenant comme suit:
- Calculez d'abord une statistique de test en calculant le score moyen en utilisant la fonction de vote pour chaque élément dans les deux groupes, cela devrait conduire à deux vecteurs de taille 25.
- Comparez ensuite les deux résultats à l'aide de la fonction de comparaison, ce sera votre statistique de test.
Le problème est que nous ne connaissons pas la distribution de la statistique de test sous le zéro que les deux groupes sont les mêmes. Mais s'ils sont identiques, nous pourrions mélanger au hasard les observations entre les groupes.
Ainsi, nous pouvons combiner les données de deux groupes, les mélanger / permuter, choisir le premier n1 (nombre d'observations dans le groupe A d'origine) observations pour le groupe A et le reste pour le groupe B. Calculez maintenant la statistique de test pour cet échantillon en utilisant les deux étapes précédentes.
Répétez le processus environ 1000 fois et utilisez maintenant les statistiques du test de permutation comme distribution empirique nulle. Cela vous permettra de calculer une valeur de p, et n'oubliez pas de faire un bel histogramme et de tracer une ligne pour votre statistique de test comme ceci:
Maintenant, bien sûr, il s'agit de choisir les bonnes fonctions de vote et de comparaison pour obtenir un bon pouvoir. Cela dépend vraiment de votre objectif et de votre intuition, mais je pense que ma deuxième suggestion pour la fonction de vote et lal1La norme est un bon point de départ. Notez que ces choix peuvent faire et font une grande différence. L'intrigue ci-dessus utilisait lel1 norme et ce sont les mêmes données avec un l2 norme:
Mais selon le paramètre, je m'attends à ce qu'il puisse y avoir beaucoup d'aléatoire intrinsèque et vous aurez besoin d'une taille d'échantillon assez grande pour que la méthode passe-partout fonctionne. Si vous avez des connaissances préalables sur des choses spécifiques qui, selon vous, peuvent être différentes entre les deux groupes (par exemple, des éléments spécifiques), utilisez-les pour personnaliser vos deux fonctions. (Bien sûr, d'habitude, faites-le avant d'exécuter le test et ne choisissez pas les conceptions jusqu'à ce que vous obteniez quelque chose d'important s'applique)
PS me tirer un message si vous êtes intéressé par mon code (en désordre). C'est un peu trop long à ajouter ici mais je serais heureux de le télécharger.
the best ways to compare these rankings
- quel type de différence entre les 2 groupes aimeriez-vous savoir?