Encoches du diagramme en boîte vs intervalle de Tukey-Kramer

Le document d'aide "notch" ( ou le texte original ) de boxplot dans 'R' donne ce qui suit:

Si les encoches de deux parcelles ne se chevauchent pas, cela constitue une «preuve solide» que les deux médianes diffèrent (Chambers et al, 1983, p. 62). Voir boxplot.stats pour les calculs utilisés.

et le « boxplot.stats » donne ce qui suit:

Les encoches (si demandé) s'étendent jusqu'à +/- 1,58 IQR / sqrt (n). Cela semble reposer sur les mêmes calculs que la formule avec 1,57 dans Chambers et al (1983, p. 62), donnée dans McGill et al (1978, p. 16). Ils sont basés sur la normalité asymptotique de la médiane et des tailles d'échantillon à peu près égales pour les deux médianes comparées, et seraient plutôt insensibles aux distributions sous-jacentes des échantillons. L'idée semble être de donner à peu près un intervalle de confiance de 95% pour la différence entre deux médianes.

Maintenant, je connais mieux l'utilisation de la version JMP du test de Tukey-Kramer pour comparer les moyennes des colonnes. La documentation pour JMP donne ceci:

Affiche un test dimensionné pour toutes les différences entre les moyens. Il s'agit du test Tukey ou Tukey-Kramer HSD (différence honnêtement significative). (Tukey 1953, Kramer 1956). Ce test est un test de niveau alpha exact si les tailles d'échantillon sont les mêmes, et conservateur si les tailles d'échantillon sont différentes (Hayter 1984).

Question: Quelle est la nature du lien entre les deux approches? Existe-t-il un moyen de transformer l'un en l'autre?

Il semble que l'on recherche un IC d'environ 95% pour la médiane et qu'il y ait chevauchement; et l'autre est un "test alpha exact" (mes échantillons sont de la même taille) pour déterminer si les médianes de deux ensembles d'échantillons sont dans une plage raisonnable l'une de l'autre.

Je fais référence à des packages, mais je m'intéresse aux mathématiques derrière la logique.

— EngrStudent
source

En ce qui concerne le boxplot à encoches, la référence de McGill et al [1] mentionnée dans votre question contient des détails assez complets (tout ce que je dis ici n'y est pas explicitement mentionné, mais néanmoins il est suffisamment détaillé pour le comprendre).

L'intervalle est robuste mais gaussien

$M$ $R$

M \pm 1.7 \times 1.25 R / (1.35 \sqrt{N})

$M\pm 1.7 \times 1.25R/(1.35\sqrt{N})$

où:

$1.35$ $\sigma$ $\sigma$ $R/1.35$ $\sigma$
$1.25$ $\frac{1}{4nf_0^2}$ $f_0$ $f_0$ $\frac{1}{\sqrt{2\pi}\sigma}\approx \frac{0.3989}{\sigma}$ $\frac{1}{2\sqrt{N}f_0}= \sqrt{\pi/2}\sigma/\sqrt{N}\approx 1.253\sigma/\sqrt{N}$

$N$

$1.25R/(1.35\sqrt{N})$
Il ne reste donc plus qu'à discuter du facteur de 1,7.

Notez que si nous comparions un échantillon à une valeur fixe (disons une médiane hypothétique), nous utiliserions 1,96 pour un test à 5%; par conséquent, si nous avions deux erreurs types très différentes (une relativement grande, une très petite), ce serait à peu près le facteur à utiliser (car si la valeur nulle était vraie, la différence serait presque entièrement due à la variation de celle avec la plus grande erreur standard, et la petite pourrait - approximativement - être traitée comme effectivement corrigée).

$1.96/\sqrt{2}\approx 1.386$

$r$ $r:1$ $1.96/\sqrt{1+1/r}$

Les rassembler tous (1,35, 1,25 et 1,7) ensemble donne environ 1,57. Certaines sources obtiennent 1,58 en calculant le 1,35 ou le 1,25 (ou les deux) plus précisément, mais comme compromis entre 1,386 et 1,96, ce 1,7 n'est même pas précis à deux chiffres significatifs (c'est juste une valeur de compromis approximative), donc la précision supplémentaire est inutile (ils auraient aussi bien pu arrondir le tout à 1,6 et en finir avec ça).

Notez qu'il n'y a aucun ajustement pour les comparaisons multiples ici.

Il y a des analogies distinctes dans les limites de confiance pour une différence dans le HSD Tukey-Kramer :

{\bar{y}}_{i ∙} - {\bar{y}}_{j ∙} \pm \frac{q_{α; k; N - k}}{\sqrt{2}} {\hat{σ}}_{ε} \sqrt{\frac{1}{n_{i}} + \frac{1}{n_{j}}}

$\bar{y}_{i\bullet}-\bar{y}_{j\bullet} \pm \frac{q_{\alpha;k;N-k}}{\sqrt{2}}\widehat{\sigma}_\varepsilon \sqrt{\frac{1}{n_i} + \frac{1}{n_j}}$

Mais notez que

$c.\sqrt{\frac{1}{n_i} + \frac{1}{n_j}}$ $k.\sqrt{\frac{1}{n_{i}}}$ $k.\sqrt{\frac{1}{n_j}}$ $1.96$ $1.96/\sqrt{2}$
c'est basé sur les moyens, pas sur les médianes (donc pas 1,35)
$q$ $\sqrt{2}$

Ainsi, bien que plusieurs des idées sous-jacentes à la forme des composants soient quelque peu analogues, elles sont en fait assez différentes dans ce qu'elles font.

[1] McGill, R., Tukey, JW et Larsen, WA (1978) Variations des boîtes à moustaches. The American Statistician 32, 12-16.

— Glen_b -Reinstate Monica
source