Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?


15

Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte de plus d'informations. Cependant, une et une seule hypothèse à ne pas négliger lors de l'utilisation de ce type de test est l'hypothèse d'échangeabilité des échantillons sous l'hypothèse nulle. Il est également à noter que ce type d'approche peut également être appliqué lorsqu'il existe plus de deux échantillons comme celui implémenté dans le coinpackage R.

Pouvez-vous utiliser un langage figuratif ou une intuition conceptuelle en anglais simple pour illustrer cette hypothèse? Ce serait très utile pour clarifier cette question oubliée parmi les non-statisticiens comme moi.

Remarque:
Il serait très utile de mentionner un cas où l'application d'un test de permutation ne tient pas ou n'est pas valide dans la même hypothèse.

Mise à jour:
Supposons que 50 sujets soient prélevés au hasard dans la clinique locale de mon district. Ils ont été assignés au hasard au médicament reçu ou à un placebo dans un rapport de 1: 1. Ils ont tous été mesurés pour le paramètre 1 Par1à V1 (ligne de base), V2 (3 mois plus tard) et V3 (1 an plus tard). Les 50 sujets peuvent être sous-groupés en 2 groupes en fonction de la fonction A; Un positif = 20 et un négatif = 30. Ils peuvent également être sous-groupés en 2 autres groupes en fonction de la caractéristique B; B positif = 15 et B négatif = 35.
Maintenant, j'ai des valeurs de Par1tous les sujets à toutes les visites. Dans l'hypothèse de l'interchangeabilité, puis-je faire une comparaison entre les niveaux d' Par1utilisation du test de permutation si je voulais:
- Comparer les sujets avec le médicament à ceux qui ont reçu le placebo au V2?
- Comparer les sujets avec la fonctionnalité A avec ceux ayant la fonctionnalité B à V2?
- Comparer les sujets ayant la caractéristique A à V2 avec ceux ayant la caractéristique A mais à V3?
- Dans quelle situation cette comparaison serait invalide et violerait l'hypothèse d'échangeabilité?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
Supposons que j'avais chaque observation sur une feuille séparée de papier à feuilles mobiles et que je vous ai tendu la pile, j'ai glissé et les feuilles ont volé dans toutes les directions alors qu'elles s'installaient au sol. Ce serait dommage si cela détruisait la validité du test que vous espériez effectuer sur ces données. Si vos observations sont échangeables et que vous appliquiez un test basé sur cela, vous me consoleriez et me diriez de ne pas m'inquiéter tout en m'aidant à ramasser les papiers sur le sol. Sinon, et la collecte de données était particulièrement coûteuse, je devrais peut-être courir pour ma vie.
cardinal du

2
D'autre part, l' ordre ne soit pour des choses telles que les données de séries chronologiques (en général) et les essais doivent généralement respecter cet ordre d'une manière appropriée.
cardinal du

@cardinal, alors que votre histoire intuitive a dessiné une image vivante de la façon dont cette hypothèse ressemble, mais je suis toujours confus quant à la façon de juger si les papiers précieux tombés étaient échangeables ou non. Vous pouvez vous présenter pour un autre commentaire si c'est possible!
doctorat

Réponses:


7

FXOuiZ(X=1,y=3,z=2)=FXOuiZ(X=3,y=2,z=1), etc). Si ce n'est pas le cas, le comptage des permutations n'est pas un moyen valide de tester l'hypothèse nulle, car chaque permutation aura un poids différent (probabilité / densité). Tests de Permutation dépendent de chaque attribution d'un ensemble donné de numérique valeurs à vos variables ayant la même densité / probabilité.

F(X1=1,X2=2,X3=3 ...XN=N)F(X1=N,X2=N-1,X3=N-2 ...XN=1)


+1, bien que l'échange soit bien expliqué, mais j'ai quand même été trébuché en essayant d'appliquer la métaphore des pots sur l'étude en cours. (voir la mise à jour de la question). Compte tenu de la durée des visites et des sous-groupes en fonction des fonctionnalités, comment puis-je juger si la comparaison de ces valeurs serait échangeable ou non?
doctorat

@doctorate: il semble que vous stratifiez vos groupes en fonction de facteurs pertinents pour le résultat de Par1, n'est-ce pas? Tant que vous utilisez des permutations dans un quadrant de fermeture A / B particulier, je suppose que vos sujets sont échangeables. Votre premier test, qui couvrira toutes les fonctionnalités, devra être traité plus avant avant de pouvoir utiliser un test qui repose sur l'échange. en particulier, vous devez quantifier l'effet du traitement et corriger les effets de confusion des caractéristiques A et B - sinon, la taille du groupe influencera les résultats globaux (paradoxe de simpson)

1
@doctorate: J'ai réalisé que mon commentaire ci-dessus était peut-être un peu oblique par rapport à ce que vous vouliez: les pots dans votre cas seraient les paires de fonctionnalités, c'est-à-dire (A +, B +), (A-, B +), (A +, B -), (B-, A-) pour un total de 4 "pots". Est-ce que cela aide à le rendre plus concret?

Tks, mais ce qui confond les non-statisticiens comme moi, c'est comment peut-on juger si cette hypothèse a été satisfaite ou non? il existe souvent des tests pour examiner les hypothèses, par exemple, pour la normalité, il y a le test de Shapiro-Wilk. Mais je me demande quel test examinerait l'échange. sinon, la définition serait très difficile ou vague et deux statisticiens pourraient ne pas s'entendre sur tel ou tel sous-groupe. Comme vous l'avez mentionné, dans le quadrant A / B aucun problème, mais dans Drug / Placebo, vous avez montré une certaine inquiétude. Existe-t-il un test d'acide pour cette hypothèse?
doctorat

2
En ce qui concerne l'échange, il n'y a pas de "test" pour l'échange. Contrairement à l'indépendance (qui est testable), l'échange est plus une hypothèse de modélisation que si vous aviez prélevé des échantillons répétés comme celui que vous avez pris, vous constateriez que chaque permutation se produit exactement la même fraction du temps. Vous n'avez qu'un seul échantillon, vous ne pouvez donc pas le "tester".
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.