De nombreuses études en sciences sociales utilisent les échelles de Likert. Quand est-il approprié d'utiliser les données Likert comme ordinales et quand est-il approprié de les utiliser comme données d'intervalle?
De nombreuses études en sciences sociales utilisent les échelles de Likert. Quand est-il approprié d'utiliser les données Likert comme ordinales et quand est-il approprié de les utiliser comme données d'intervalle?
Réponses:
Peut-être trop tard mais j'ajoute quand même ma réponse ...
Cela dépend de ce que vous avez l'intention de faire avec vos données: Si vous souhaitez montrer que les scores diffèrent lorsque vous considérez un groupe de participants différent (sexe, pays, etc.), vous pouvez traiter vos scores comme des valeurs numériques, à condition qu'ils remplissent les hypothèses habituelles. sur la variance (ou la forme) et la taille de l'échantillon. Si vous souhaitez plutôt mettre en évidence la manière dont les modèles de réponse varient selon les sous-groupes, vous devez alors considérer les scores d'élément comme un choix discret parmi un ensemble d'options de réponse et rechercher une modélisation log-linéaire, une régression logistique ordinale, des modèles d'élément de réponse ou tout autre modèle statistique. cela permet de gérer des objets polytomiques.
En règle générale, on considère généralement que 11 points distincts sur une échelle suffisent pour se rapprocher d'une échelle d'intervalle (pour l'interprétation, voir le commentaire de @ xmjx)). Les éléments de Likert peuvent être considérés comme de vraies échelles ordinales, mais ils sont souvent utilisés sous forme numérique et nous pouvons calculer leur moyenne ou SD. Cela se fait souvent dans les enquêtes sur les attitudes, bien qu'il soit judicieux de déclarer à la fois la moyenne / écart-type et le pourcentage de réponse, par exemple dans les deux catégories les plus élevées.
Lorsque vous utilisez des scores d’échelle sommés (c’est-à-dire que nous additionnons le score de chaque élément pour calculer un "score total"), les statistiques habituelles peuvent être appliquées, mais vous devez garder à l’esprit que vous travaillez maintenant avec une variable latente afin que le construit sous-jacent devrait avoir un sens! En psychométrie, on vérifie généralement que (1) l'unidimensionnalité de l'échelle est vérifiée, (2) la fiabilité de l'échelle est suffisante. Lors de la comparaison de deux de ces scores d'échelle (pour deux instruments différents), nous pourrions même envisager d'utiliser des mesures de corrélation atténuées au lieu du coefficient de corrélation de Pearson classique.
Les manuels classiques incluent:
1. Nunnally, JC et Bernstein, IH (1994). Psychometric Theory (3ème éd.). Série McGraw-Hill en psychologie.
2. Streiner, DL et Norman, GR (2008). Échelles de mesure de la santé. Un guide pratique pour leur développement et leur utilisation (4ème éd.). Oxford.
3. Rao, CR et Sinharay, S., Eds. (2007). Manuel de statistique, vol. 26: Psychométrie . Elsevier Science BV
4. Dunn, G. (2000). Statistiques en psychiatrie . Hodder Arnold.
Vous pouvez également consulter les applications des modèles de traits latents et de classes latentes en sciences sociales de Rost & Langeheine et du site Web de W. Revelle sur la recherche de la personnalité .
Lors de la validation d’une échelle psychométrique, il est important d’examiner ce que l’on appelle les effets de plafond / plancher (asymétrie importante résultant de la notation des participants dans la catégorie de réponse la plus basse / la plus élevée), ce qui peut avoir un impact important sur les statistiques calculées lorsqu’elles sont traitées comme une variable numérique ( par exemple, agrégation de pays, test t). Cela soulève des questions spécifiques dans les études interculturelles, car il est connu que la distribution globale des réponses dans les enquêtes sur les attitudes ou la santé diffère d’un pays à l’autre (par exemple, les Chinois par rapport à ceux venant de pays occidentaux ont tendance à mettre en évidence un type de réponse spécifique, les premiers ayant scores généralement plus extrêmes au niveau des articles, voir par exemple Song, X.-Y. (2007), Analyse de modèles d'équations structurelles multi-échantillons avec applications aux données de qualité de vie, enManuel de variables latentes et de modèles associés , Lee, S.-Y. (Ed.), Pp 279-302, Hollande du Nord).
Plus généralement, vous devriez consulter la littérature liée à la psychométrie, qui fait un usage intensif des éléments de Likert si vous êtes intéressé par un problème de mesure. Divers modèles statistiques ont été développés et sont actuellement dirigés dans le cadre de la théorie de la réponse par élément.
La réponse simple est que les échelles de Likert sont toujours ordinales. Les intervalles entre les positions sur l’échelle sont monotones, mais ne sont jamais aussi bien définis que des incréments numériquement uniformes.
Cela dit, la distinction entre ordinal et intervalle est basée sur les exigences spécifiques de l'analyse en cours. Dans des circonstances spéciales, vous pourrez peut-être traiter les réponses comme si elles tombaient sur une échelle d'intervalle. Pour ce faire, les répondants doivent généralement s'entendre sur le sens des réponses et l'analyse (ou les décisions prises sur la base de l'analyse) doit être relativement insensible aux problèmes qui peuvent survenir.
En plus de ce qui a déjà été dit ci-dessus à propos des échelles cumulées, je voudrais également mentionner que le problème peut changer lors de l'analyse des données au niveau du groupe. Par exemple, si vous examiniez
Dans tous ces cas, chaque mesure globale (peut-être la moyenne) est basée sur de nombreuses réponses individuelles (par exemple, n = 50, 100, 1000, etc.). Dans ces cas, l'élément Likert d'origine commence à prendre des propriétés qui ressemblent à une échelle d'intervalle au niveau agrégé.
échelle de Likert toujours sous forme ordinale: méthode permettant d'attribuer une valeur quantitative à des données qualitatives, afin de la rendre compatible avec une analyse statistique. Une valeur numérique est attribuée à chaque choix potentiel et un chiffre moyen pour toutes les réponses est calculé à la fin de l'évaluation ou de l'enquête.