Une réponse courte est que c'est controversé. Contrairement aux conseils que vous mentionnez, les gens dans de nombreux domaines utilisent des échelles ordinales et sont souvent heureux que cela signifie qu'ils font ce qu'ils veulent. Les moyennes en points ou l'équivalent dans de nombreux systèmes éducatifs en sont un exemple.
Cependant, les données ordinales qui ne sont pas normalement distribuées ne sont pas une raison valable, car la moyenne est
largement utilisé pour les distributions non normales
bien défini mathématiquement pour de très nombreuses distributions non normales, sauf dans certains cas pathologiques.
Ce n'est peut-être pas une bonne idée d'utiliser la moyenne dans la pratique si les données ne sont certainement pas distribuées normalement, mais c'est différent.
Une raison plus importante pour ne pas utiliser la moyenne avec des données ordinales est que sa valeur dépend des conventions de codage. Les codes numériques tels que 1, 2, 3, 4 sont généralement choisis simplement pour des raisons de simplicité ou de commodité, mais en principe, ils pourraient tout aussi bien être 1, 23, 456, 7890 dans la mesure où ils correspondent à un ordre défini. Prendre la moyenne dans les deux cas impliquerait de prendre ces conventions à la lettre (à savoir, comme si les chiffres n'étaient pas arbitraires, mais justifiables), et il n'y a pas de motif rigoureux pour le faire. Vous avez besoin d'une échelle d'intervalle dans laquelle des différences égales entre les valeurs peuvent être prises littéralement pour justifier la prise de moyennes. C'est ce que je considère comme l'argument principal, mais comme déjà indiqué, les gens l'ignorent souvent et délibérément, car ils trouvent les moyens utiles, quoi qu'en disent les théoriciens de la mesure.
Voici un exemple supplémentaire. Souvent, les gens sont invités à choisir l'un des "fortement en désaccord" ... "fortement d'accord" et (selon en partie ce que le logiciel veut) les chercheurs codent cela comme 1 .. 5 ou 0 .. 4 ou tout ce qu'ils veulent, ou le déclarer comme facteur ordonné (ou quel que soit le terme utilisé par le logiciel). Ici, le codage est arbitraire et caché aux personnes qui répondent à la question.
Mais souvent, on demande aussi aux gens sur une échelle de 1 à 5, comment évaluez-vous quelque chose? Les exemples abondent: sites Web, sports, autres types de compétitions et même éducation. Ici, on montre aux gens une échelle et on lui demande de l'utiliser. Il est largement admis que les non-entiers ont un sens, mais vous êtes simplement autorisé à utiliser des entiers comme convention. Est-ce une échelle ordinale? Certains disent oui, certains disent non. Autrement dit, une partie du problème est que ce qui est échelle ordinale est lui-même une zone floue ou débattue.
Considérez à nouveau les notes pour le travail académique, dites E à A. Souvent, ces notes sont également traitées numériquement, disons de 1 à 5, et les gens calculent régulièrement des moyennes pour les étudiants, les cours, les écoles, etc. et effectuent de nouvelles analyses de ces données. S'il est vrai que tout mappage avec des scores numériques est arbitraire mais acceptable tant qu'il préserve l'ordre, néanmoins dans la pratique, les personnes attribuant et recevant les notes savent que les scores ont des équivalents numériques et savent que les notes seront moyennées .
Une raison pragmatique d'utiliser des moyens est que les médianes et les modes sont souvent de mauvais résumés des informations contenues dans les données. Supposons que vous ayez une échelle allant de fortement en désaccord à fortement d'accord et pour des raisons de commodité, codez les points 1 à 5. Imaginez maintenant un échantillon codé 1, 1, 2, 2, 2 et un autre 1, 2, 2, 4, 5. Maintenant, augmentez vos mains si vous pensez que la médiane et le mode sont les seuls résumés justifiables car c'est une échelle ordinale. Maintenant, levez la main si vous trouvez la moyenne également utile, que les sommes soient bien définies, etc.
Naturellement, la moyenne serait un résumé hypersensible si les codes étaient des carrés ou des cubes de 1 à 5, disons, et ce n'est peut-être pas ce que vous voulez. (Si votre objectif est d'identifier rapidement les hauts voleurs, cela pourrait être exactement ce que vous voulez!) Mais c'est précisément pourquoi le codage conventionnel avec des codes entiers successifs est un choix pratique, car il fonctionne souvent très bien en pratique. Ce n'est pas un argument qui a du poids auprès des théoriciens de la mesure, et cela ne devrait pas non plus, mais les analystes de données devraient être intéressés à produire des résumés riches en informations.
Je suis d'accord avec tous ceux qui disent: utilisez toute la distribution des fréquences de notes, mais ce n'est pas le problème.