Le document d'aide "notch" ( ou le texte original ) de boxplot dans 'R' donne ce qui suit:
Si les encoches de deux parcelles ne se chevauchent pas, cela constitue une «preuve solide» que les deux médianes diffèrent (Chambers et al, 1983, p. 62). Voir boxplot.stats pour les calculs utilisés.
et le « boxplot.stats » donne ce qui suit:
Les encoches (si demandé) s'étendent jusqu'à +/- 1,58 IQR / sqrt (n). Cela semble reposer sur les mêmes calculs que la formule avec 1,57 dans Chambers et al (1983, p. 62), donnée dans McGill et al (1978, p. 16). Ils sont basés sur la normalité asymptotique de la médiane et des tailles d'échantillon à peu près égales pour les deux médianes comparées, et seraient plutôt insensibles aux distributions sous-jacentes des échantillons. L'idée semble être de donner à peu près un intervalle de confiance de 95% pour la différence entre deux médianes.
Maintenant, je connais mieux l'utilisation de la version JMP du test de Tukey-Kramer pour comparer les moyennes des colonnes. La documentation pour JMP donne ceci:
Affiche un test dimensionné pour toutes les différences entre les moyens. Il s'agit du test Tukey ou Tukey-Kramer HSD (différence honnêtement significative). (Tukey 1953, Kramer 1956). Ce test est un test de niveau alpha exact si les tailles d'échantillon sont les mêmes, et conservateur si les tailles d'échantillon sont différentes (Hayter 1984).
Question: Quelle est la nature du lien entre les deux approches? Existe-t-il un moyen de transformer l'un en l'autre?
Il semble que l'on recherche un IC d'environ 95% pour la médiane et qu'il y ait chevauchement; et l'autre est un "test alpha exact" (mes échantillons sont de la même taille) pour déterminer si les médianes de deux ensembles d'échantillons sont dans une plage raisonnable l'une de l'autre.
Je fais référence à des packages, mais je m'intéresse aux mathématiques derrière la logique.