Dans quelles conditions les échelles de Likert doivent-elles être utilisées comme données ordinales ou à intervalles?


52

De nombreuses études en sciences sociales utilisent les échelles de Likert. Quand est-il approprié d'utiliser les données Likert comme ordinales et quand est-il approprié de les utiliser comme données d'intervalle?


6
Techniquement, les échelles de Likert sont la somme d'éléments de type Likert et constituent donc une approximation raisonnable (du moins selon de nombreux psychométriciens en psychologie) d'un point de données d'intervalle.
russellpierce

2
@drknexus - Plusieurs éléments servent donc de triangulation de mesure pour les échelles de construction? Si oui, quels sont les critères permettant de déterminer qu'un chercheur dispose de suffisamment de points de données pertinents (c.-à-d. Éléments) pour utiliser l'échelle comme mesure d'intervalle?
Un lion

2
Je ne suis pas sûr; cela pourrait être une question valable pour la communauté en général. J'imagine que c'est en partie un jugement de valeur de la part du chercheur et du domaine. Certaines zones sont tout à fait disposées à traiter un seul élément de Likert comme un intervalle, même s’il est clairement ordinal. Une réponse raisonnable pourrait être d’utiliser une méthode d’analyse différente, par exemple un test de permutation ou de bootstrap. Une autre solution pourrait consister à effectuer un simple test de normalité, tant que l'agrégat ne s'écarte pas de manière significative de la normalité, vous êtes probablement d'accord.
russellpierce

1
... mais en général, il semble que l'on puisse évoquer le théorème de la limite centrale et suggérer que 20 à 30 items devraient suffire pour utiliser l'échelle comme mesure d'intervalle.
russellpierce

Réponses:


41

Peut-être trop tard mais j'ajoute quand même ma réponse ...

Cela dépend de ce que vous avez l'intention de faire avec vos données: Si vous souhaitez montrer que les scores diffèrent lorsque vous considérez un groupe de participants différent (sexe, pays, etc.), vous pouvez traiter vos scores comme des valeurs numériques, à condition qu'ils remplissent les hypothèses habituelles. sur la variance (ou la forme) et la taille de l'échantillon. Si vous souhaitez plutôt mettre en évidence la manière dont les modèles de réponse varient selon les sous-groupes, vous devez alors considérer les scores d'élément comme un choix discret parmi un ensemble d'options de réponse et rechercher une modélisation log-linéaire, une régression logistique ordinale, des modèles d'élément de réponse ou tout autre modèle statistique. cela permet de gérer des objets polytomiques.

En règle générale, on considère généralement que 11 points distincts sur une échelle suffisent pour se rapprocher d'une échelle d'intervalle (pour l'interprétation, voir le commentaire de @ xmjx)). Les éléments de Likert peuvent être considérés comme de vraies échelles ordinales, mais ils sont souvent utilisés sous forme numérique et nous pouvons calculer leur moyenne ou SD. Cela se fait souvent dans les enquêtes sur les attitudes, bien qu'il soit judicieux de déclarer à la fois la moyenne / écart-type et le pourcentage de réponse, par exemple dans les deux catégories les plus élevées.

Lorsque vous utilisez des scores d’échelle sommés (c’est-à-dire que nous additionnons le score de chaque élément pour calculer un "score total"), les statistiques habituelles peuvent être appliquées, mais vous devez garder à l’esprit que vous travaillez maintenant avec une variable latente afin que le construit sous-jacent devrait avoir un sens! En psychométrie, on vérifie généralement que (1) l'unidimensionnalité de l'échelle est vérifiée, (2) la fiabilité de l'échelle est suffisante. Lors de la comparaison de deux de ces scores d'échelle (pour deux instruments différents), nous pourrions même envisager d'utiliser des mesures de corrélation atténuées au lieu du coefficient de corrélation de Pearson classique.

Les manuels classiques incluent:
1. Nunnally, JC et Bernstein, IH (1994). Psychometric Theory (3ème éd.). Série McGraw-Hill en psychologie.
2. Streiner, DL et Norman, GR (2008). Échelles de mesure de la santé. Un guide pratique pour leur développement et leur utilisation (4ème éd.). Oxford.
3. Rao, CR et Sinharay, S., Eds. (2007). Manuel de statistique, vol. 26: Psychométrie . Elsevier Science BV
4. Dunn, G. (2000). Statistiques en psychiatrie . Hodder Arnold.

Vous pouvez également consulter les applications des modèles de traits latents et de classes latentes en sciences sociales de Rost & Langeheine et du site Web de W. Revelle sur la recherche de la personnalité .

Lors de la validation d’une échelle psychométrique, il est important d’examiner ce que l’on appelle les effets de plafond / plancher (asymétrie importante résultant de la notation des participants dans la catégorie de réponse la plus basse / la plus élevée), ce qui peut avoir un impact important sur les statistiques calculées lorsqu’elles sont traitées comme une variable numérique ( par exemple, agrégation de pays, test t). Cela soulève des questions spécifiques dans les études interculturelles, car il est connu que la distribution globale des réponses dans les enquêtes sur les attitudes ou la santé diffère d’un pays à l’autre (par exemple, les Chinois par rapport à ceux venant de pays occidentaux ont tendance à mettre en évidence un type de réponse spécifique, les premiers ayant scores généralement plus extrêmes au niveau des articles, voir par exemple Song, X.-Y. (2007), Analyse de modèles d'équations structurelles multi-échantillons avec applications aux données de qualité de vie, enManuel de variables latentes et de modèles associés , Lee, S.-Y. (Ed.), Pp 279-302, Hollande du Nord).

Plus généralement, vous devriez consulter la littérature liée à la psychométrie, qui fait un usage intensif des éléments de Likert si vous êtes intéressé par un problème de mesure. Divers modèles statistiques ont été développés et sont actuellement dirigés dans le cadre de la théorie de la réponse par élément.


2
Juste pour clarification: Nunnally / Bernstein suggère de traiter une variable comme continue si elle a au moins 11 valeurs distinctes (p. 115). Où est cette règle de base "12 points impliquent l'échelle d'intervalle"?
xmjx

12

La réponse simple est que les échelles de Likert sont toujours ordinales. Les intervalles entre les positions sur l’échelle sont monotones, mais ne sont jamais aussi bien définis que des incréments numériquement uniformes.

Cela dit, la distinction entre ordinal et intervalle est basée sur les exigences spécifiques de l'analyse en cours. Dans des circonstances spéciales, vous pourrez peut-être traiter les réponses comme si elles tombaient sur une échelle d'intervalle. Pour ce faire, les répondants doivent généralement s'entendre sur le sens des réponses et l'analyse (ou les décisions prises sur la base de l'analyse) doit être relativement insensible aux problèmes qui peuvent survenir.


8
John Tukey a écrit le contraire (en 1960) dans une monographie "Data Analysis and Behavioral Science" (publiée dans Collected Works v. III). L'un des résultats qu'il a obtenus est que, si vous obtenez un taux supérieur à environ 10% selon l'accord de test-retest, votre échelle n'est pas assez étroite!
whuber

Cette réponse semble confondre les échelles de Likert avec les éléments d'évaluation originaux. Voir le commentaire de @ russellpierce.
rolando2

9

En plus de ce qui a déjà été dit ci-dessus à propos des échelles cumulées, je voudrais également mentionner que le problème peut changer lors de l'analyse des données au niveau du groupe. Par exemple, si vous examiniez

  • satisfaction de la vie des états ou des pays,
  • satisfaction au travail des organisations ou des départements,
  • satisfaction des étudiants dans les matières.

Dans tous ces cas, chaque mesure globale (peut-être la moyenne) est basée sur de nombreuses réponses individuelles (par exemple, n = 50, 100, 1000, etc.). Dans ces cas, l'élément Likert d'origine commence à prendre des propriétés qui ressemblent à une échelle d'intervalle au niveau agrégé.


-2

échelle de Likert toujours sous forme ordinale: méthode permettant d'attribuer une valeur quantitative à des données qualitatives, afin de la rendre compatible avec une analyse statistique. Une valeur numérique est attribuée à chaque choix potentiel et un chiffre moyen pour toutes les réponses est calculé à la fin de l'évaluation ou de l'enquête.


5
Bienvenue sur notre site! Veuillez attribuer votre devis ou, en général, tout mot que vous empruntez à quelqu'un d'autre.
whuber
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.