Je travaille à travers les exemples de Doing Bayesian Data Analysis de Kruschke , en particulier l'ANOVA exponentielle de Poisson en ch. 22, qu'il présente comme une alternative aux tests d'indépendance du chi carré fréquentiste pour les tables de contingence.
Je peux voir comment nous obtenons des informations sur les interactions qui se produisent plus ou moins fréquemment que ce qui serait attendu si les variables étaient indépendantes (c'est-à-dire lorsque l'IDH exclut zéro).
Ma question est de savoir comment puis-je calculer ou interpréter une taille d'effet dans ce cadre? Par exemple, Kruschke écrit "la combinaison des yeux bleus avec des cheveux noirs se produit moins fréquemment que ce à quoi on pourrait s'attendre si la couleur des yeux et la couleur des cheveux étaient indépendantes", mais comment pouvons-nous décrire la force de cette association? Comment savoir quelles interactions sont plus extrêmes que d'autres? Si nous faisions un test du chi carré de ces données, nous pourrions calculer le V de Cramér comme mesure de la taille globale de l'effet. Comment exprimer la taille de l'effet dans ce contexte bayésien?
Voici l'exemple autonome du livre (codé R
), juste au cas où la réponse me serait cachée à la vue ...
df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15,
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond",
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))
df
Blue Brown Green Hazel
Black 20 68 5 15
Blond 94 7 16 10
Brunette 84 119 29 54
Red 17 26 14 14
Voici la sortie fréquentiste, avec des mesures de taille d'effet (pas dans le livre):
vcd::assocstats(df)
X^2 df P(> X^2)
Likelihood Ratio 146.44 9 0
Pearson 138.29 9 0
Phi-Coefficient : 0.483
Contingency Coeff.: 0.435
Cramer's V : 0.279
Voici la sortie bayésienne, avec les IDH et les probabilités de cellule (directement à partir du livre):
# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R",
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")
# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))
# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))
Et voici des tracés du modèle exponentiel postérieur de Poisson appliqué aux données:
Et des graphiques de la distribution postérieure sur les probabilités cellulaires estimées: