Questions marquées «binary-data»

Une variable binaire prend l'une des deux valeurs, généralement codées «0» et «1».

1
Comment interpréter le coefficient de deuxième étape dans la régression des variables instrumentales avec un instrument binaire et une variable endogène binaire?
(message assez long, désolé. Il comprend de nombreuses informations générales, alors n'hésitez pas à passer à la question en bas.) Intro: Je travaille sur un projet où nous essayons d'identifier l'effet d'une variable endogène binaire, , sur un résultat continu, . Nous avons mis au point un instrument, , que …



1
Est-ce jamais une bonne idée d'accorder un «crédit partiel» (résultat continu) à la formation d'une régression logistique?
J'entraîne une régression logistique pour prédire quels coureurs sont les plus susceptibles de terminer une course d'endurance exténuante. Très peu de coureurs terminent cette course, j'ai donc un grave déséquilibre de classe et un petit échantillon de succès (peut-être quelques dizaines). Je sens que je pourrais obtenir un bon "signal" …

1
Quels sont les dangers du calcul des corrélations de Pearson (au lieu des corrélations tétrachoriques) pour les variables binaires dans l'analyse factorielle?
Je fais des recherches sur les jeux éducatifs, et certains de mes projets actuels impliquent l'utilisation de données de BoardGameGeek (BGG) et VideoGameGeek (VGG) pour examiner les relations entre les éléments de conception des jeux (c.-à-d. ) et les cotes des joueurs de ces jeux (c.-à-d. des scores sur 10). …

3
Comment visualiser la qualité de l'ajustement bayésien pour la régression logistique
Pour un problème de régression logistique bayésienne, j'ai créé une distribution prédictive postérieure. J'échantillonne à partir de la distribution prédictive et reçois des milliers d'échantillons de (0,1) pour chaque observation que j'ai. Visualiser la qualité de l'ajustement est loin d'être intéressant, par exemple: Ce graphique montre les 10 000 échantillons …


1
R régression linéaire variable catégorielle valeur «cachée»
Ceci est juste un exemple que j'ai rencontré plusieurs fois, donc je n'ai pas d'échantillons de données. Exécution d'un modèle de régression linéaire dans R: a.lm = lm(Y ~ x1 + x2) x1est une variable continue. x2est catégorique et a trois valeurs, par exemple "Low", "Medium" et "High". Cependant, la …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 




3
Calcul de Jaccard ou d'un autre coefficient d'association pour des données binaires en utilisant la multiplication matricielle
Je veux savoir s'il existe un moyen possible de calculer le coefficient de Jaccard en utilisant la multiplication matricielle. J'ai utilisé ce code jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) …

2
Calculer la courbe ROC pour les données
Donc, j'ai 16 essais dans lesquels j'essaie d'authentifier une personne à partir d'un trait biométrique en utilisant Hamming Distance. Mon seuil est fixé à 3,5. Mes données sont ci-dessous et seul l'essai 1 est un vrai positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 


3
Séries chronologiques binaires
J'ai une série chronologique binaire: nous avons 2160 données (0 = ne s'est pas produit, 1 = s'est produit) pour une période d'une heure en 90 jours. Je veux prévoir après ces 90 jours, où le prochain 1 se produira, et également étendre cette disposition pour un mois prochain.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.