Questions marquées «categorical-encoding»

Représenter les variables catégorielles comme des ensembles de variables numériques. Nécessaire dans de nombreux types d'analyses pour traiter des données catégorielles. Un exemple courant est l'utilisation d'un prédicteur catégoriel dans la régression / ANOVA via le codage fictif, le codage d'effet, le codage Helmert, les contrastes définis par l'utilisateur, etc.




1
Suppression d'une des colonnes lors de l'utilisation d'un codage à chaud
Ma compréhension est que dans l'apprentissage automatique, cela peut être un problème si votre ensemble de données a des fonctionnalités hautement corrélées, car elles codent efficacement les mêmes informations. Récemment, quelqu'un a souligné que lorsque vous effectuez un codage à chaud sur une variable catégorielle, vous vous retrouvez avec des …

3
Quand faut-il utiliser la régression multiple avec codage fictif vs ANCOVA?
J'ai récemment analysé une expérience qui a manipulé 2 variables catégorielles et une variable continue en utilisant ANCOVA. Cependant, un examinateur a suggéré que la régression multiple avec la variable catégorielle codée comme variables fictives est un test plus approprié pour les expériences avec des variables catégorielles et continues. Quand …


5
Comment recoder une variable catégorielle en variable numérique lors de l'utilisation de SVM ou de Neural Network
Pour utiliser SVM ou Neural Network, il doit transformer (encoder) des variables catégorielles en variables numériques, la méthode normale dans ce cas est d'utiliser des valeurs binaires 0-1 avec la k-ème valeur catégorielle transformée en (0,0, .. ., 1,0, ... 0) (1 est en position k-ème). Existe-t-il d'autres méthodes pour …


2
Le codage des variables qualitatives en régression conduit à des «singularités»
J'ai une variable indépendante appelée "qualité"; cette variable a 3 modalités de réponse (mauvaise qualité; qualité moyenne; haute qualité). Je veux introduire cette variable indépendante dans ma régression linéaire multiple. Lorsque j'ai une variable indépendante binaire (variable fictive, je peux coder 0/ 1), il est facile de l'introduire dans un …

2
«Variable fictive» versus «variable indicatrice» pour les données nominales / catégorielles
«Variable factice» et «variable indicatrice» sont des termes fréquemment utilisés pour décrire l'appartenance à une catégorie avec un codage 0/1; généralement 0: pas un membre de la catégorie, 1: membre de la catégorie. Le 26/11/2014, une recherche rapide sur scholar.google.com (avec guillemets inclus) révèle que "variable fictive" est utilisée dans …


1
Quels sont les différents types de codages disponibles pour les variables catégorielles (en R) et quand les utiliseriez-vous?
Si vous ajustez un modèle linéaire ou un modèle mixte, il existe différents types de codages disponibles pour transformer une varibale catégorielle ou nominale en un certain nombre de variables pour lesquelles les paramètres sont estimés, tels que le conditionnement fictif (la valeur par défaut R) et le codage des …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.