Comment construire un intervalle de confiance à 95% de la différence entre les médianes?

Mon problème: essai randomisé en groupe parallèle ayant une distribution très asymétrique du résultat principal. Je ne veux pas assumer la normalité et utiliser des IC à 95% normaux (c'est-à-dire en utilisant 1,96 X SE).

Je suis à l'aise d'exprimer la mesure de la tendance centrale en tant que médiane, mais ma question est alors de savoir comment construire un IC à 95% de la différence de médiane entre les deux groupes.

La première chose qui vient à l'esprit est l'amorçage (rééchantillonnage avec remplacement, déterminer la médiane dans chacun des deux groupes et soustraire l'un de l'autre, répéter 1000 fois et utiliser l'IC à 95% corrigé du biais). Est-ce la bonne approche? D'autres suggestions?

— pmgjones
source

C'était aussi la première chose qui m'est venue à l'esprit. Quelle est la taille de votre échantillon?

— jbowman

40 personnes dans chacun des deux groupes = 80 au total.

— pmgjones

Vous pouvez examiner l'intervalle de confiance non paramétrique et l'estimateur pour la différence des paramètres de localisation basés sur l' estimateur de Hodges-Lehmann . Comme expliqué dans la page d'aide pour les R wilcox.test()(sous Details), cela est étroitement lié à la différence de médiane, mais pas tout à fait la même.

— caracal

En ce qui concerne l'amorçage de la médiane, il pourrait être utile de lire sur le bootstrap lissé.

— caracal

@caracal: C'est un bon point. Le bootstrap habituel ou lissé a une couverture asymptotique correcte, mais la probabilité de couverture du bootstrap lissé converge à un rythme légèrement plus rapide. Si je me souviens bien,

pour l'amorçage d' habitude, et

pour le bootstrap lissé. Nous en discutons brièvement avec d'autres références dans Quantile Regression de Koenker (2005).

| P (m \in {\hat{I}}_{n}) - 0.95 | = O (n^{- 1 / 3})

$|P(m \in \hat{I}_n) - 0.95| = O(n^{-1/3})$

O (n^{- 2 / 5})

$O(n^{-2/5})$

— Paul

Réponses:

La procédure d'amorçage que vous décrivez doit être valide. Cependant, il est important de garder à l'esprit que, comme l'IC 95% basé sur la normale, un intervalle de confiance bootstrap n'est garanti que pour avoir une couverture correcte asymptotiquement. Une bonne chose à propos de l'utilisation de la médiane ou d'autres quantiles est que vous pouvez construire des intervalles de confiance d'échantillons finis exacts sous des hypothèses très faibles. L'idée de base est que sous la valeur nulle de la médiane de est , l'indicateur de $y$ $m$ est une variable aléatoire de Bernoulli 0,5. Vous pouvez utiliser cette observation pour créer une statistique de test avec une distribution d'échantillons finis connue. VoirChernozhukov, Hansen, Jansson (2009)pour plus de détails. $y < m$

— Paul
source

Pourriez-vous, s'il vous plaît, expliquer ce que vous entendez par le fait qu'il n'est valable qu'asymptotiquement? Je ne sais pas exactement ce que signifie asymptotiquement dans ce contexte. Merci!

— pmgjones

{\hat{I}}_{n}

$\hat{I}_n$

m

$m$

P (m \in {\hat{I}}_{n}) = 0.95

$P(m \in \hat{I}_n) = 0.95$

m

$m$

{\hat{I}}_{n}

$\hat{I}_n$

P (m \in {\hat{I}}_{n}) = 0.95

$P(m \in \hat{I}_n) = 0.95$

lim_{n \to \infty} P (m \in {\hat{I}}_{n}) = 0.95

$\lim_{n \to \infty} P(m \in \hat{I}_n) = 0.95$

Vous pouvez également essayer la méthode suggérée dans http://www.ncbi.nlm.nih.gov/pubmed/12243307 (Bonett, Price; 2002) comme alternative plus simple (au moins sur le plan informatique, je pense). Bonne question, au fait.

— AVB
source