Je supposerai qu'une variable "catégorique" représente en réalité une variable ordinale; sinon, cela n'a pas beaucoup de sens de le traiter comme une variable continue, à moins que ce ne soit une variable binaire (codée 0/1) comme indiqué par @Rob. Ensuite, je dirais que le problème n’est pas tellement la façon dont nous traitons la variable, bien que de nombreux modèles aient déjà été développés pour l’ analyse de données catégoriques - voir par exemple, L’analyse des données catégorielles ordonnées: aperçu et enquête récente. développements de Liu et Agresti-, que l’échelle de mesure sous-jacente que nous supposons. Ma réponse portera sur ce deuxième point, bien que je traiterai d'abord brièvement de l'attribution de scores numériques à des catégories ou à des niveaux variables.
En utilisant un simple recodage numérique d'une variable ordinale, vous supposez que celle-ci possède des propriétés d'intervalle (au sens de la classification donnée par Stevens, 1946). Du point de vue de la théorie de la mesure (en psychologie), cela peut souvent être une hypothèse trop forte, mais pour une étude de base (c’est-à-dire lorsqu'un seul élément est utilisé pour exprimer son opinion sur une activité quotidienne avec une formulation claire), tout score monotone devrait donner des résultats comparables. . Cochran (1954) a déjà signalé que
tout ensemble de scores donne un
test valide , à condition qu'ils soient construits sans consulter les résultats de l'expérience. Si l'ensemble des scores est faible, en ce sens qu'il déforme fortement une échelle numérique qui sous-tend réellement la classification ordonnée, le test ne sera pas sensible. Les scores doivent donc refléter les meilleures informations disponibles sur la manière dont la classification a été construite et utilisée. (p. 436)
(Un grand merci à @whuber pour m'avoir rappelé cela tout au long de l'un de ses commentaires, ce qui m'a amené à relire le livre d'Agresti, d'où provient cette citation.)
M2M2= ( n - 1 ) r2
Vous pouvez également décider de recoder votre variable sur une plage irrégulière ou d’agréger certains de ses niveaux, mais dans ce cas, un déséquilibre important entre les catégories recodées peut fausser les tests statistiques, par exemple le test de tendance susmentionné. Une alternative intéressante pour attribuer une distance entre les catégories avait déjà été proposée par @Jeromy, à savoir une mise à l'échelle optimale.
Maintenant, parlons du deuxième point que j'ai présenté, celui du modèle de mesure sous-jacent. J'hésite toujours à ajouter la balise "psychométrie" lorsque je vois ce genre de question, car la construction et l'analyse des échelles de mesure relèvent de la théorie psychométrique (Nunnally et Bernstein, 1994 pour un aperçu complet). Je ne m'attarderai pas sur tous les modèles qui se trouvent dans la théorie de la réponse à l' item , et je renvoie gentiment le lecteur intéressé au didacticiel de I. Partchev, Guide visuel de la théorie de la réponse à l'item, pour une introduction en douceur à la TRI, et aux références (5-8) énumérées à la fin des taxonomies possibles pour la TRI. Très brièvement, l’idée est qu’au lieu d’attribuer des distances arbitraires entre des catégories de variables, vous assumez une échelle latente et estimez leur emplacement sur ce continuum, ainsi que les capacités ou les responsabilités des individus. Un exemple simple vaut beaucoup de notation mathématique, considérons donc l'item suivant (tiré du questionnaire sur la qualité de vie lié à la santé EORTC QLQ-C30 ):
Avez-vous vous inquiéter?
qui est codé sur une échelle de quatre points, allant de "pas du tout" à "beaucoup". Les scores bruts sont calculés en attribuant un score de 1 à 4. Les scores des éléments appartenant à la même échelle peuvent ensuite être additionnés pour donner ce que l'on appelle une échelle, qui indique le rang sur le construit sous-jacent (ici, une composante de santé mentale ). Ces scores sur une échelle sommée sont très pratiques en raison de la facilité de notation (pour le praticien ou l'infirmière), mais ils ne sont rien de plus qu'une échelle discrète (ordonnée).
Nous pouvons également considérer que la probabilité d’endosser une catégorie de réponses donnée obéit à une sorte de modèle logistique, comme décrit dans le tutoriel de I. Partchev, mentionné ci-dessus. Fondamentalement, l’idée est celle d’un type de modèle à seuil (qui aboutit à une formulation équivalente en termes de modèle de probabilité proportionnelle ou cumulative) et nous modélisons les chances de figurer dans une catégorie de réponse plutôt que la précédente ou les chances de marquer au-dessus d’un point. certaine catégorie, conditionnée à la localisation des sujets sur le trait latent. De plus, nous pouvons imposer que les catégories de réponses soient équidistantes sur l’échelle latente (c’est le modèle de l’échelle d’évaluation) - c’est ce que nous faisons en attribuant des scores numériques régulièrement espacés - ou non (c’est le modèle du crédit partiel). .
Clairement, nous n’ajoutons pas grand chose à la théorie des tests classiques, où les variables ordinales sont traitées comme des variables numériques. Cependant, nous introduisons un modèle probabiliste, dans lequel nous supposons une échelle continue (avec des propriétés d’intervalle) et où des erreurs de mesure spécifiques peuvent être comptabilisées, et nous pouvons intégrer ces scores factoriels à n’importe quel modèle de régression.
Références
- SS Stevens. Sur la théorie des échelles de mesure. Science , 103 : 677-680, 1946.
- χ2
- J Nunnally et moi Bernstein. Théorie psychométrique . McGraw-Hill, 1994
- Alan Agresti. Analyse de données catégorique . Wiley, 1990.
- CR Rao et S Sinharay, éditeurs. Manuel de statistique, vol. 26: Psychométrie . Elsevier Science BV, Pays-Bas, 2007.
- Un Boomsma, MAJ van Duijn et TAB Snijders. Essais sur la théorie de la réponse par élément . Springer, 2001.
- D Thissen et L. Steinberg. Une taxonomie des modèles de réponse d'item. Psychometrika , 51 (4) : 567-577, 1986.
- P Mair et R Hatzinger. Extended Rasch Modélisation: Le paquet pour l'application eRM des modèles IRT en R . Journal of Statistical Software , 20 (9) , 2007.