Merci d'avance de m'avoir accompagné, je ne suis aucun statisticien et je ne sais pas comment décrire ce que j'imagine, donc Google ne m'aide pas ici ...
J'inclus un système de notation dans une application Web sur laquelle je travaille. Chaque utilisateur peut évaluer chaque élément exactement une fois.
J'imaginais une échelle avec 4 valeurs: "n'aime pas du tout", "n'aime pas", "aime" et "fortement aime", et j'avais prévu d'attribuer ces valeurs de -5, -2, +2 et +5 respectivement .
Maintenant, si chaque article devait avoir le même nombre de notes, je serais assez à l'aise avec ce système de notation qui différencie clairement les articles les plus aimés et les moins aimés. Cependant, les articles n'auront pas le même nombre de notes et la disparité entre le nombre de votes sur différentes photos peut être assez dramatique.
Dans ce cas, la comparaison des scores cumulés sur deux éléments signifie qu'un ancien élément avec beaucoup de notes médiocres aura un score beaucoup plus élevé qu'un nouvel élément exceptionnel avec beaucoup moins de votes.
Donc, la première chose évidente à laquelle j'ai pensé que nous prenions une moyenne ... mais maintenant, si un article n'a qu'une seule note de "+5", il a une meilleure moyenne qu'un article qui a un score de 99 "+5". et 1 "+2". Intuitivement, ce n'est pas une représentation précise de la popularité d'un article.
J'imagine que ce problème est courant et vous n'avez pas besoin de moi pour le développer avec plus d'exemples, alors je m'arrêterai à ce stade et j'élaborerai dans les commentaires si nécessaire.
Mes questions sont:
- Comment s'appelle ce type de problème et existe-t-il un terme pour les techniques utilisées pour le résoudre? J'aimerais le savoir pour pouvoir le lire.
- Si vous connaissez des ressources conviviales sur le sujet, j'apprécierais beaucoup un lien.
- Enfin, j'apprécierais toute autre suggestion sur la manière de collecter et d'analyser efficacement ce type de données.