Questions marquées «categorical-data»

Les données catégorielles (également appelées nominales) peuvent prendre un nombre limité de valeurs possibles appelées catégories. Les valeurs catégorielles "étiquettent", elles ne "mesurent" pas. Veuillez utiliser la balise [ordinal-data] pour les types de données discrets mais ordonnés.

5
Quelle est la meilleure façon de visualiser la relation entre les variables discrètes et continues?
Quelle est la meilleure façon de montrer une relation entre: variable continue et discrète, deux variables discrètes? Jusqu'à présent, j'ai utilisé des diagrammes de dispersion pour examiner la relation entre les variables continues. Cependant, dans le cas de variables discrètes, les points de données sont cumulés à certains intervalles. Ainsi, …


5
Comment recoder une variable catégorielle en variable numérique lors de l'utilisation de SVM ou de Neural Network
Pour utiliser SVM ou Neural Network, il doit transformer (encoder) des variables catégorielles en variables numériques, la méthode normale dans ce cas est d'utiliser des valeurs binaires 0-1 avec la k-ème valeur catégorielle transformée en (0,0, .. ., 1,0, ... 0) (1 est en position k-ème). Existe-t-il d'autres méthodes pour …


4
Non-transitivité de la corrélation: corrélations entre le sexe et la taille du cerveau et entre la taille du cerveau et le QI, mais pas de corrélation entre le sexe et le QI
J'ai trouvé l'explication suivante sur un blog et j'aimerais obtenir plus d'informations sur la non-transitivité de la corrélation: Nous avons les faits incontestables suivants: En moyenne, il existe une différence de volume cérébral entre les hommes et les femmes Il existe une corrélation entre le QI et la taille du …


1
Comment gérer un SVM avec des attributs catégoriels
J'ai un espace de 35 dimensions (attributs). Mon problème analytique est un problème de classification simple. Sur 35 dimensions, plus de 25 sont catégoriques et chaque attribut prend plus de 50 types de valeurs. Dans ce scénario, l'introduction d'une variable fictive ne fonctionnera pas non plus pour moi. Comment puis-je …


2
Détection d'anomalies avec des fonctions factices (et d'autres fonctions discrètes / catégorielles)
tl; dr Quelle est la méthode recommandée pour traiter les discretedonnées lors de la détection d'anomalies? Quelle est la méthode recommandée pour traiter les categoricaldonnées lors de la détection d'anomalies? Cette réponse suggère d'utiliser des données discrètes pour filtrer simplement les résultats. Peut-être remplacer la valeur de la catégorie par …


3
La construction d'un classificateur multiclasse est-elle meilleure que plusieurs classificateurs binaires?
J'ai besoin de classer les URL en catégories. Disons que j'ai 15 catégories que je prévois de mettre à zéro chaque URL. Un classificateur à 15 voies est-il meilleur? Où j'ai 15 étiquettes et génère des fonctionnalités pour chaque point de données. Ou construire 15 classificateurs binaires, par exemple: film …


2
Le codage des variables qualitatives en régression conduit à des «singularités»
J'ai une variable indépendante appelée "qualité"; cette variable a 3 modalités de réponse (mauvaise qualité; qualité moyenne; haute qualité). Je veux introduire cette variable indépendante dans ma régression linéaire multiple. Lorsque j'ai une variable indépendante binaire (variable fictive, je peux coder 0/ 1), il est facile de l'introduire dans un …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.