Questions marquées «non-independent»

Les données, événements, processus, etc., ne sont pas indépendants si la connaissance de 1 fournit des informations sur l'état ou la valeur de l'autre.

5
Sur l'importance de l'hypothèse iid dans l'apprentissage statistique
Dans l’apprentissage statistique, implicitement ou explicitement, on suppose toujours que l’apprentissage D={X,y}ré={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \} est composé de NNN tuples d’entrée / réponse qui sont indépendamment tirés du même joint distribution avec(Xi,yi)(Xje,yje)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) et la relation que nous essayons …


5
La signification de «dépendance positive» comme condition pour utiliser la méthode habituelle de contrôle FDR
Benjamini et Hochberg ont mis au point la première méthode (et toujours la plus largement utilisée, selon moi) pour contrôler le taux de fausses découvertes (FDR). Je veux commencer par un groupe de valeurs P, chacune pour une comparaison différente, et décider quelles sont suffisamment basses pour être appelées une …


1
Propriétés de l'ACP pour les observations dépendantes
Nous utilisons généralement l'ACP comme technique de réduction de la dimensionnalité pour les données où les cas sont supposés être iid Question: Quelles sont les nuances typiques dans l'application de l'ACP pour des données dépendantes et non iid? Quelles propriétés agréables / utiles de PCA détiennent pour les données iid …

1
Signification en langage clair des tests «dépendants» et «indépendants» dans la littérature des comparaisons multiples?
Dans la littérature sur le taux d'erreur au niveau de la famille (FWER) et sur le taux de fausses découvertes (FDR), des méthodes particulières de contrôle du FWER ou du FDR conviennent aux tests dépendants ou indépendants. Par exemple, dans l'article de 1979 "Une procédure de test multiple à rejet …

3
Pour l'intuition, quels sont des exemples concrets de variables aléatoires non corrélées mais dépendantes?
Pour expliquer pourquoi non corrélé n'implique pas indépendant, il existe plusieurs exemples qui impliquent un tas de variables aléatoires, mais elles semblent toutes si abstraites: 1 2 3 4 . Cette réponse semble logique. Mon interprétation: Une variable aléatoire et son carré peuvent ne pas être corrélés (car apparemment, le …

1
Pourquoi les modèles à effets mixtes résolvent-ils la dépendance?
Imaginons que nous nous intéressions à la façon dont les notes des étudiants sont affectées par le nombre d'heures que ces étudiants étudient. Pour explorer cette relation, nous pourrions exécuter la régression linéaire suivante: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Mais si nous échantillonnons des élèves …





5
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


6
Dans quelle mesure est-il problématique de contrôler les covariables non indépendantes dans une étude d'observation (c.-à-d. Non randomisée)?
Miller et Chapman (2001) soutiennent qu'il est absolument inapproprié de contrôler les covariables non indépendantes qui sont liées à la fois aux variables indépendantes et dépendantes dans une étude observationnelle (non randomisée) - même si cela se fait régulièrement en sciences sociales. Dans quelle mesure est-ce problématique de le faire? …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.