Est-il approprié de traiter les données de l'échelle de Likert à n points comme n essais d'un processus binomial?

11

Je n'ai jamais aimé la façon dont les gens analysent généralement les données des échelles de Likert comme si l'erreur était continue et gaussienne lorsqu'il existe des attentes raisonnables que ces hypothèses soient violées au moins aux extrémités des échelles. Que pensez-vous de l'alternative suivante:

Si la réponse prend la valeur $k$ sur une échelle à $n$ points, étendez ces données à $n$ essais, dont $k$ ont la valeur 1 et $n-k$ dont la valeur 0. Ainsi, nous traitons la réponse sur une échelle de Likert comme s'il s'agit de l'agrégat manifeste d'une série secrète d'essais binomiaux (en fait, du point de vue des sciences cognitives, il s'agit en fait d'un modèle attrayant pour les mécanismes impliqués dans de tels scénarios de prise de décision). Avec les données développées, vous pouvez désormais utiliser un modèle à effets mixtes spécifiant le répondant comme un effet aléatoire (également une question comme un effet aléatoire si vous avez plusieurs questions) et en utilisant la fonction de lien binomial pour spécifier la distribution des erreurs.

Quelqu'un peut-il voir des violations d'hypothèses ou d'autres aspects préjudiciables de cette approche?

— Mike Lawrence
source

2

Connaissez-vous des recherches publiées qui examinent les avantages relatifs de l'utilisation d'échelles likert comme intervalles par rapport aux données ordinales? Peut-être que les défauts de les traiter comme des échelles de niveau d'intervalle ne sont pas suffisamment graves pour justifier une approche complexe. Si tel est le cas, votre approche peut simplement être une chasse aux oies sauvages.

16

Je ne connais aucun article lié à votre question dans la littérature psychométrique. Il me semble que les modèles logistiques ordonnés permettant des composants à effets aléatoires peuvent assez bien gérer cette situation.

Je suis d'accord avec @Srikant et je pense qu'un modèle de cotes proportionnelles ou un modèle probit ordonné (selon la fonction de lien que vous choisissez) pourrait mieux refléter le codage intrinsèque des éléments Likert, et leur utilisation typique comme échelles de notation dans les enquêtes d'opinion / d'attitude ou les questionnaires .

D'autres alternatives sont: (1) l'utilisation de catégories adjacentes au lieu de proportionnelles ou cumulatives (lorsqu'il y a un lien avec des modèles log-linéaires); (2) l'utilisation de modèles de réponse aux éléments comme le modèle de crédit partiel ou le modèle d'échelle de notation (comme cela a été mentionné dans ma réponse sur l' analyse des échelles de Likert ). Ce dernier cas est comparable à une approche à effets mixtes, avec des sujets traités comme des effets aléatoires, et est facilement disponible dans le système SAS (par exemple, ajustement des modèles à effets mixtes pour les résultats ordinaux répétés avec la procédure NLMIXED ) ou R (voir vol. 20 du Journal of Statistical Software ). Vous pourriez également être intéressé par la discussion fournie par John Linacre sur l' optimisation de l'efficacité de la catégorie de l'échelle de notation .

Les articles suivants peuvent également être utiles:

Wu, CH (2007). Une étude empirique sur la transformation de données à l'échelle de Likert en partitions numériques . Sciences mathématiques appliquées , 1 (58) : 2851-2862.
Rost, J et et Luo, G (1997). Une application d'un modèle de déploiement basé sur Rasch à un questionnaire sur le centrisme des adolescents . Dans Rost, J et Langeheine, R (Eds.), Applications of latent trait and latent class models in the social sciences , New York: Waxmann.
Lubke, G et Muthen, B (2004). L'analyse factorielle des données à l'échelle de Likert sous l'hypothèse de normalité multivariée complique une comparaison significative des groupes observés ou des classes latentes . Modélisation d'équations structurelles , 11 : 514-534.
Nering, ML et Ostini, R (2010). Handbook of Polytomous Item Response Theory Models . Routledge Academic
Bender R et Grouven U (1998). Utilisation de modèles de régression logistique binaire pour les données ordinales à cotes non proportionnelles. Journal of Clinical Epidemiology , 51 (10) : 809-816. (Impossible de trouver le pdf mais celui-ci est disponible, régression logistique ordinale dans la recherche médicale )

— chl
source

1

La régression logistique ordinale à effets mixtes est également disponible dans R avec le package ordinal et clmm ().

— John

9

Si vous souhaitez vraiment abandonner l'hypothèse de données de niveau d'intervalle pour des échelles de likert, je suggère que vous supposiez que les données soient un logit ou un probit ordonné à la place. Les échelles de Likert mesurent généralement la force de la réponse et, par conséquent, des valeurs plus élevées devraient indiquer une réponse plus forte sur l'élément d'intérêt sous-jacent.

$H$ $S$

$y = 1$ $S \le \alpha_1$

$y = h\$ $\alpha_{h-1} < S\ \le \alpha_h$ $h = 2, 3, ..H-1$

$y = H\$ $\alpha_{H-1} < S <\ \infty$

$S$

2

$np$ $np(1-p)$ $y$ $p$

\underset{n = 4}{Pr} (Oui = y) \neq \underset{n = 9}{Pr} (Oui = 2 y) + \underset{n = 9}{Pr} (Oui = 2 y + 1)

$\Pr_{n=4}(Y=y)\neq\Pr_{n=9}(Y=2y)+\Pr_{n=9}(Y=2y+1)$

— Scortchi - Réintégrer Monica
source

1

Vous pouvez utiliser l'approximation binomiale dans une échelle de Likert à 5 points si vous combinez l'accord et entièrement d'accord dans un groupe et le désaccord et fortement en désaccord dans un autre. Bien sûr, vous devez toujours décider où vont les neutres. Je placerais les neutres dans n'importe quel groupe, utiliserais l'approximation normale du binôme (à condition que vous ayez plus de 40 réponses), et développerais des intervalles de confiance sur les proportions de chaque groupe (voir n'importe quel texte statistique standard sur la façon d'obtenir la conf. intervalles sur les proportions provenant d'une distribution binomiale avec l'approximation normale). Ensuite, je mettrais les neutres dans l'autre groupe et refaisais les intervalles de confiance. Si j'obtiens la même conclusion des deux, alors il y a une conclusion potentielle. Sinon, je ne vois pas comment le binôme peut être utilisé avec les données de Likert.

— user35193
source

0

Si j'ai bien compris, cet article suggère une approche très similaire à ce que vous avez décrit, suggérant que oui, en effet, des données de type Likert peuvent découler d'un processus binomial.

Réf. Complète: Allik, J. (2014). Un modèle binomial mixte pour les mesures de personnalité de type Likert. Frontiers in Psychology , (5) 371

— KasiaM
source

Bienvenue sur le site! Pourriez-vous ajouter une référence complète pour ce document? C'est une pratique courante ici, car les liens ont tendance à disparaître.

— mkt

-1

En fait, je prépare un article dans lequel j'utilise votre approche consistant à traiter une réponse sur un élément similaire comme s'il s'agissait de l'agrégat manifeste d'une série secrète d'essais binomiaux.

Dans mon article, la distribution binomiale est utilisée pour expliquer la forme des distributions de fréquence observées. La justification de cette approche est donnée par deux hypothèses. Dans de nombreuses applets, montrant comment la distribution binomiale prend naissance, on a répété des essais de Bernoulli indépendants par une seule balle tombant à travers un réseau de broches. Chaque fois qu'une balle tombe sur une épingle, elle rebondit vers la droite (c'est-à-dire un succès) avec la probabilité p ou vers la gauche (c'est-à-dire un échec) avec la probabilité 1-p. Après que le ballon soit tombé dans le tableau, il atterrit dans un bac marqué par le nombre de succès correspondant. Dans mon article, le processus de prise de décision est également considéré comme une série de procès Bernoulli indépendants répétés dans lesquels, à chaque procès, le sujet décide d'accepter ou non la déclaration en question.

(i) Lors de chaque essai indépendant de Bernoulli, le sujet décide d'accepter la probabilité p ou de ne pas être d'accord (en désaccord) avec la probabilité 1-p.

(ii) Si cinq catégories de réponses sont disponibles pour la déclaration, le nombre de fois où une décision Bernoulli est prise concernant la décision d'accepter ou de ne pas être d'accord (en désaccord) est égal à 4 (5-1).

Le choix final pour une catégorie de réponse spécifique est donné par les règles suivantes.

Si dans tous les (quatre) cas une décision d'accord de Bernoulli est prise, alors la réponse «fortement d'accord» sera donnée.
Si dans trois cas une décision d'accord de Bernoulli est prise, la réponse «d'accord» sera donnée.
Si dans deux cas une décision d'accord de Bernoulli est prise, la réponse «indécise» sera donnée.
Si dans un seul cas une décision d'accord de Bernoulli est prise, la réponse «en désaccord» sera donnée.
Si en aucun cas une décision d'accord de Bernoulli n'est prise, alors la réponse «fortement en désaccord» sera donnée.

Un raisonnement similaire peut être donné en utilisant des décisions «en désaccord». Afin d'obtenir une distribution binomiale, la notation des catégories de réponses est la suivante.

pas du tout d'accord = 0, pas d'accord = 1, neutre = 2, d'accord = 3, tout à fait d'accord = 4

Ces deux hypothèses conduisent à une distribution binomiale pour les fréquences de réponse à condition qu'il n'y ait pas de différences systématiques entre les répondants.

J'espère que vous serez d'accord. J'apprécierais beaucoup si vous pouviez améliorer mon anglais dans le texte ci-dessus.

— Ad van der Ven
source

J'ai supprimé votre ancienne réponse. Veuillez noter que mon commentaire n'était pas destiné à être une remarque négative; les réponses en une seule ligne ne sont généralement pas très informatives et des réponses discutables sont à privilégier (mais voir notre FAQ ).

— chl

1

p

$p$

n

$n$