Avantages de l’utilisation de la moyenne pour résumer la tendance centrale d’une note de 5 points
Comme @gung l'a mentionné, je pense qu'il y a souvent de très bonnes raisons de considérer la moyenne d'un élément en cinq points comme un indice de tendance centrale. J'ai déjà exposé ces raisons ici .
Paraphraser:
- la moyenne est facile à calculer
- La moyenne est intuitive et bien comprise
- La moyenne est un nombre unique
- D'autres indices donnent souvent un classement similaire des objets
Pourquoi la moyenne est bonne pour Amazon
Pensez aux objectifs d'Amazon en rapportant la moyenne. Ils pourraient viser à
- fournir une note intuitive et compréhensible pour un article
- assurer l'acceptation du système de notation par l'utilisateur
- s'assurer que les gens comprennent ce que signifie l'évaluation afin de pouvoir l'utiliser de manière appropriée pour éclairer les décisions d'achat
Amazon fournit une sorte de moyenne arrondie, des comptes de fréquence pour chaque option de classement et la taille de l’échantillon (c’est-à-dire le nombre de classements). Cette information est probablement suffisante pour permettre à la plupart des gens d’apprécier à la fois le sentiment général à l’égard de cet élément et la confiance qu’il en a (un score de 4,5 sur 20 a plus de chances d’être précis que sur un 4,5 à 2; un élément de 10 5 -étoiles, et une étoile avec aucun commentaire pourrait encore être un bon article).
Vous pourriez même voir la moyenne comme une option démocratique. De nombreuses élections sont décidées en fonction du candidat qui obtient la moyenne la plus élevée sur une échelle de deux points. De même, si vous prenez l'argument que chaque personne qui soumet une révision obtient un vote, vous pouvez voir la moyenne comme un formulaire qui pondère également le vote de chaque personne.
Les différences d'échelle d'utilisation posent-elles vraiment un problème?
Il existe un large éventail de biais de notation connus dans la littérature psychologique (pour une revue, voir Saal et al 1980), tels que le biais de tendance centrale, le biais de clémence, le biais de stricte. En outre, certains évaluateurs seront plus arbitraires et d’autres plus fiables. Certains peuvent même mentir systématiquement en donnant de faux commentaires positifs ou négatifs. Cela créera diverses formes d'erreur en essayant de calculer le classement moyen réel d'un élément.
Cependant, si vous preniez un échantillon aléatoire de la population, de tels biais disparaîtraient et, avec un échantillon de taille suffisant des évaluateurs, vous obtiendriez tout de même la vraie moyenne.
Bien sûr, vous n’obtenez pas un échantillon aléatoire sur Amazon, et il existe un risque que l’ensemble des évaluateurs que vous obtenez pour un article soit systématiquement biaisé pour être plus clément ou strict, et ainsi de suite. Cela dit, je pense que les utilisateurs d'Amazon apprécieraient que les évaluations soumises par les utilisateurs proviennent d'un échantillon imparfait. Je pense aussi qu'il est très probable qu'avec un échantillon de taille raisonnable, dans la plupart des cas, la majorité des différences de biais de réponse commenceraient à disparaître.
Avancées possibles au-delà de la moyenne
En ce qui concerne l’amélioration de la précision de la notation, je ne remettrais pas en cause le concept général de la moyenne, mais je pense plutôt qu’il existe un autre moyen d’estimer la moyenne réelle de la population pour un article un grand échantillon représentatif a-t-il été invité à évaluer l'élément).
- Évaluateurs de poids en fonction de leur fiabilité
- Utilisez un système de notation bayésien qui estime la note moyenne comme la somme pondérée de la note moyenne de tous les articles et de la moyenne de chaque article, et augmentez la pondération de cet article à mesure que le nombre de notes augmente.
- Ajustez les informations d'un évaluateur en fonction de toute tendance de notation générale entre les éléments (par exemple, un 5 de quelqu'un qui donne généralement 3s vaut plus que quelqu'un qui donne généralement 4s).
Ainsi, si l'exactitude de la notation était l'objectif principal d'Amazon, je pense qu'elle devrait s'efforcer d'augmenter le nombre de notations par élément et adopter certaines des stratégies ci-dessus. De telles approches pourraient être particulièrement pertinentes lors de la création d'un classement "best-of". Cependant, pour la modeste note de la page, il se pourrait bien que la signification de l'échantillon réponde mieux aux objectifs de simplicité et de transparence.
Références
- Saal, FE, Downey, RG et Lahey, MA (1980). Notation des évaluations: évaluation de la qualité psychométrique des données d’évaluation. Psychological Bulletin, 88, 413.