Questions marquées «categorical-encoding»

Représenter les variables catégorielles comme des ensembles de variables numériques. Nécessaire dans de nombreux types d'analyses pour traiter des données catégorielles. Un exemple courant est l'utilisation d'un prédicteur catégoriel dans la régression / ANOVA via le codage fictif, le codage d'effet, le codage Helmert, les contrastes définis par l'utilisateur, etc.



3
Comment gérer les variables catégorielles non binaires dans la régression logistique (SPSS)
Je dois faire une régression logistique binaire avec beaucoup de variables indépendantes. La plupart d'entre elles sont binaires, mais quelques-unes des variables catégorielles ont plus de deux niveaux. Quelle est la meilleure façon de gérer ces variables? Par exemple, pour une variable avec trois valeurs possibles, je suppose que deux …

4
Comment prouver statistiquement si une colonne contient des données catégoriques ou non en utilisant Python
J'ai un bloc de données en python où j'ai besoin de trouver toutes les variables catégorielles. La vérification du type de la colonne ne fonctionne pas toujours car le inttype peut également être catégorique. Je cherche donc de l'aide pour trouver la bonne méthode de test d'hypothèse pour identifier si …

1
R régression linéaire variable catégorielle valeur «cachée»
Ceci est juste un exemple que j'ai rencontré plusieurs fois, donc je n'ai pas d'échantillons de données. Exécution d'un modèle de régression linéaire dans R: a.lm = lm(Y ~ x1 + x2) x1est une variable continue. x2est catégorique et a trois valeurs, par exemple "Low", "Medium" et "High". Cependant, la …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 



1
Codage fictif des contrastes: 0,1 vs 1, -1
Je cherche votre aide pour comprendre la différence entre deux contrastes différents pour les variables dichotomiques. Sur cette page: http://www.psychstat.missouristate.edu/multibook/mlt08.htm sous "Variables des prédicteurs dichotomiques", il existe deux façons de coder les prédicteurs dichotomiques: en utilisant le contraste 0,1 ou le contraste 1, -1 . Je comprends en quelque sorte …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.