Comment transformer les données ordinales du questionnaire en données d'intervalle appropriées?


13

Existe-t-il des méthodes simples pour transformer les données de niveau ordinal en niveau d'intervalle (tout comme il en existe pour l'inverse)? Et exécutable dans Excel ou SPSS?

Ayant les données, disons: 10 questions au niveau ordinal (disons échelle 0-5, où 0 = "pas du tout", 5 = "tout le temps"), je veux les transformer afin qu'elles puissent être traitées comme appropriées données de niveau d'intervalle à des fins de tests paramétriques (distribution normale, tests non paramétriques hors de question).

Serait extrêmement reconnaissant pour les réponses!


Comment peut-on avoir des valeurs 6, 7, 8, 9, 10 sur une échelle de 0 à 5, ou est-ce que je manque quelque chose?
ttnphns

3
Qu'entendez-vous par simple? Convertir des variables catégorielles en échelles métriques n'est pas une tâche simple. Il existe certains modèles de variables latentes (comme les modèles IRT) qui, compte tenu de certaines hypothèses, permettent de le faire. Une autre façon est la mise à l'échelle optimale. Mais pour cela, je suppose que vous devez être prêt à faire des choses avec R et à vous plonger dans certaines statistiques avancées comme les modèles de variables latentes ou PCA non linéaire. Cela vous semble-t-il correct?
Momo

Réponses:


25

Cette réponse discutera des modèles possibles du point de vue de la mesure , où l'on nous donne un ensemble de variables ou mesures corrélées observées (manifestes), dont la variance partagée est supposée mesurer une construction bien identifiée mais pas directement observable (généralement, dans une réflexion manière), qui sera considérée comme une variable latente . Si vous n'êtes pas familier avec le modèle de mesure des caractères latents, je recommanderais les deux articles suivants: L'attaque des psychométriciens , par Denny Borsbooom, et Latent Variable Modeling: A Survey , par Anders Skrondal et Sophia Rabe-Hesketh. Je vais d'abord faire une légère digression avec des indicateurs binaires avant de traiter des éléments avec plusieurs catégories de réponses.

Une façon de transformer les données de niveau ordinal en échelle d'intervalle consiste à utiliser une sorte de modèle de réponse d'élément . Un exemple bien connu est le modèle Rasch , qui étend l'idée du modèle de test parallèle de la théorie de test classique pour faire face aux éléments binaires.grâce à un modèle linéaire à effets mixtes généralisé (avec lien logit) (dans une partie de l'implémentation logicielle «moderne»), où la probabilité d'approuver un élément donné est fonction de la «difficulté de l'élément» et de la «capacité de la personne» (en supposant qu'il n'y a pas interaction entre sa position sur le caractère latent mesuré et l'emplacement de l'élément sur la même échelle logit - qui pourrait être capturé par un paramètre de discrimination d'élément supplémentaire, ou interaction avec des caractéristiques spécifiques à l'individu - qui est appelé fonctionnement différentiel de l'élément ). La construction sous-jacente est supposée être unidimensionnelle, et la logique du modèle Rasch est simplement que le répondant a une certaine `` quantité de construction '' - parlons de la responsabilité du sujet (sa `` capacité ''),θθ . Pour donner un exemple concret, considérons la question suivante: "J'ai eu du mal à me concentrer sur autre chose que mon anxiété" (oui / non). Une personne souffrant de troubles anxieux est plus susceptible de répondre positivement à cette question par rapport à un individu choisi au hasard dans la population générale et n'ayant pas d'antécédents de dépression ou de troubles liés à l'anxiété.

N=766α=0,971[0,967;0,975]). Initialement, cinq catégories de réponses ont été proposées (1 = «Jamais», 2 = «Rarement», 3 = «Parfois», 4 = «Souvent» et 5 = «Toujours») pour chaque élément. Nous ne considérerons ici que les réponses binaires.

entrez la description de l'image ici
(Ici, les réponses aux éléments de type Likert ont été recodées sous forme de réponses binaires (1/2 = 0, 3-5 = 1), et nous considérons que chaque élément est également discriminant entre les individus, d'où le parallélisme entre les pentes de la courbe des éléments (Rasch modèle).)

X axe des , qui reflète le trait latent (anxiété), qui sont censées exprimer plus de ce trait sont plus susceptibles de répondre positivement à des questions comme «Je me suis senti terrifié» (terrible ) ou «J'ai eu des sentiments de panique soudains» (panique) que les personnes situées à gauche (population normale, peu susceptible d'être considérée comme un cas); d'autre part, il n'est pas improbable qu'une personne de la population générale déclare avoir du mal à s'endormir (dormir): pour une personne située à une portée intermédiaire du caractère latent, disons 0 logit, sa probabilité de marquer 3 ou plus est d'environ 0,5 (ce qui est la difficulté de l'objet).

Pour les articles polytomiques avec des catégories ordonnées, il existe plusieurs choix: le modèle de crédit partiel , le modèle d'échelle de notation ou le modèle de réponse graduée , pour n'en nommer que quelques-uns qui sont principalement utilisés dans la recherche appliquée. Les deux premiers appartiennent à la soi-disant "famille Rasch" des modèles IRT et partagent les propriétés suivantes: (a) la monotonie de la fonction de probabilité de réponse (courbe de réponse item / catégorie), (b) la suffisance du score individuel total (avec latent paramètre considéré comme fixe), (c) ce qui signifie que, en fonction du caractère latent, les réponses sont indépendantes des variables externes spécifiques à l'individu (par exemple, le sexe, l'âge, l'ethnicité, le SSE). indépendance locale signifiant que les réponses aux items sont indépendantes, conditionnelles au trait latent, et (d) absence de fonctionnement différentiel des items

En étendant l'exemple précédent au cas où les cinq catégories de réponse sont effectivement prises en compte, un patient aura une probabilité plus élevée de choisir la catégorie de réponse 3 à 5, par rapport à une personne échantillonnée dans la population générale, sans antécédent de troubles liés à l'anxiété. Comparés à la modélisation de l'élément dichotomique décrite ci-dessus, ces modèles prennent en compte soit le seuil cumulatif (par exemple, les chances de répondre à 3 contre 2 ou moins), soit le seuil de catégorie adjacente (les chances de répondre à 3 contre 2), qui est également discuté dans la catégorie d'Agresti. L'analyse des données(chapitre 12). La principale différence entre les modèles susmentionnés réside dans la façon dont les transitions d'une catégorie de réponse à l'autre sont gérées: le modèle de crédit partiel ne suppose pas que la différence entre un emplacement de seuil donné et la moyenne des emplacements de seuil sur le trait latent est égale ou uniforme entre les articles, contrairement au modèle d'échelle de notation. Une autre différence subtile entre ces modèles est que certains d'entre eux (comme la réponse graduelle non contrainte ou le modèle de crédit partiel) permettent des paramètres de discrimination inégaux entre les éléments. Voir Application de la modélisation de la théorie de la réponse aux éléments pour évaluer les propriétés des éléments et de l'échelle du questionnaire , par Reeve et Fayers, ou La base de la théorie de la réponse aux éléments , par Frank B. Baker, pour plus de détails.

Parce que dans le cas précédent, nous avons discuté de l'interprétation des courbes de probabilité des réponses pour les éléments notés de manière dichotomique, examinons les courbes de réponse des éléments dérivées d'un modèle de réponse gradué, en mettant en évidence les mêmes éléments cibles:

entrez la description de l'image ici
(Modèle de réponse gradué sans contrainte, permettant une discrimination inégale entre les éléments.)

Ici, les observations suivantes méritent réflexion:

  • [2;2,5] eu du mal à dormir") va d'env. 0,35 à 0,4; avec «formidable», cette probabilité passe de moins de 0,1 à environ 0,25 (ligne bleue en pointillés). Si vous souhaitez faire la distinction entre deux patients présentant des signes d'anxiété, ce dernier élément est plus informatif.
  • Il y a un décalage global, de gauche à droite, entre l'item évaluant la qualité du sommeil et ceux évaluant des conditions plus sévères, bien que les troubles du sommeil ne soient pas rares. Cela est attendu: après tout, même les personnes de la population générale peuvent éprouver des difficultés à s'endormir, indépendamment de leur état de santé, et les personnes gravement déprimées ou anxieuses sont susceptibles de présenter de tels problèmes. Cependant, il est peu probable que les «personnes normales» (si cela a un sens) présentent des signes de trouble panique (la probabilité qu'elles choisissent la catégorie de réponse la plus élevée est nulle pour les personnes situées jusqu'à la plage intermédiaire ou plus du trait latent, [ 0; 1]).

θ

En plus d'être considérés comme de véritables modèles de mesure , ce qui rend les modèles de Rasch attractifs, c'est que les scores de somme, en tant que statistique suffisante , peuvent être utilisés comme substituts des scores latents. De plus, la propriété de suffisance implique aisément la séparabilité des paramètres du modèle (personnes et items) (dans le cas des items polytomiques, il ne faut pas oublier que tout s'applique au niveau de la catégorie de réponse des items), d'où l'additivité conjointe.

Un bon examen de la hiérarchie de modèle IRT, avec R mise en œuvre, est disponible dans Mair et l'article de Hatzinger publié dans le Journal of Statistical Software : Extended Rasch Modélisation: Le paquet pour l'application eRM des modèles IRT en R . D'autres modèles incluent des modèles log-linéaires , un modèle non paramétrique, comme le modèle Mokken , ou des modèles graphiques .

En dehors de R, je ne connais pas les implémentations d'Excel, mais plusieurs packages statistiques ont été proposés sur ce fil: Comment commencer à appliquer la théorie de la réponse aux éléments et quel logiciel utiliser?

Enfin, si vous souhaitez étudier les relations entre un ensemble d'éléments et une variable de réponse sans avoir recours à un modèle de mesure, une certaine forme de quantification variable via une mise à l'échelle optimale peut également être intéressante. Outre les implémentations R discutées dans ces threads, des solutions SPSS ont également été proposées sur les threads associés .

Les références

  1. Pilkonis, P., Choi, S., Reise, S., Stover, A. et Riley, W. et al. (2011). Banques d'articles pour mesurer la détresse émotionnelle à partir du système d'information sur la mesure des résultats déclarés par les patients (PROMIS): dépression, anxiété et colère . Assessment , 18 (3), 263–283.
  2. Choi, S., Gibbons, L. et Crane, P. (2011). lordif: Un package R pour détecter le fonctionnement différentiel des articles en utilisant la régression logistique ordinale hybride itérative / la théorie de la réponse des articles et les simulations de monte carlo . Journal of Statistical Software , 39 (8).

@Momo Merci. C'est curieux. En répondant (et en rééditant cette réponse aujourd'hui), je n'ai pas remarqué votre commentaire qui vaut un gros +1. N'hésitez pas à modifier ma réponse où bon vous semble.
chl

3

Dans son livre Analysis of Ordinal Categorical Data , Alan Agresti en couvre plusieurs. L'un d'eux est ridits, dont je discute sur mon blog


1
Pouvez-vous expliquer cela un peu plus? À première vue, il semble que toute méthode qui prétend traduire objectivement des données ordinales en données d'intervalle soit magique, car il semble que vous pourriez toujours donner des contre-exemples pas si pathologiques qui "casseraient" n'importe quelle méthode, mais je pourrais manquer quelque chose d'important. Il semble également qu'il faudrait une notion a priori de la distance entre les catégories ordinales - d'où cela vient-il?
Macro

Les formules sont dans le billet de blog, et une discussion complète est dans le livre d'Agresti, mais essentiellement, il utilise les données pour créer des «proportions cumulées moyennes» et les utilise ensuite comme des scores. La distance vient des proportions dans chaque réponse, plutôt que de quoi que ce soit dans les catégories elles-mêmes.
Peter Flom - Réintègre Monica

2
+1. Les ridits sont facilement expliqués comme fraction moins + (1/2) fraction égale. Ainsi, si 1, 2, 3, 4, 5 ont observé des fractions ou des probabilités 0,2, 0,4, 0,2, 0,1, 0,1, alors le ridit de 1 est 0,1; celle de 2 est de 0,4, etc. Les ridits traitent les catégories de manière symétrique et sont moins susceptibles que la fraction inférieure ou la fraction plus d'inclure 0 ou 1 en conséquence, ce qui est souvent gênant.
Nick Cox du

Le nom ridit était lui-même destiné facétieusement par Bross (note: référence nécessaire) et l'explication supposée est du charabia. De meilleurs noms sont la fonction de distribution moyenne (Parzen 1993) et la fonction de grade Haberman (1996). Haberman, SJ 1996. Statistiques avancées Volume I: Description des populations . New York: Springer. Parzen, E. 1993. Changer le tracé PP et la fonction de quantile d'échantillon continu. Communications in Statistics - Theory and Methods 22: 3287-3304.
Nick Cox

1
Les ridits eux-mêmes peuvent être poussés par exemple par des fonctions quantiles normales ou gaussiennes.
Nick Cox
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.