Problème: je suis en train de paramétrer des distributions à utiliser comme a priori et des données dans une méta-analyse bayésienne. Les données sont fournies dans la littérature sous forme de statistiques résumées, presque exclusivement supposées être normalement distribuées (bien qu'aucune des variables ne puisse être <0, certaines sont des ratios, certaines sont de masse, etc.).
J'ai rencontré deux cas pour lesquels je n'ai pas de solution. Parfois, le paramètre d'intérêt est l'inverse des données ou le rapport de deux variables.
Exemples:
- le rapport de deux variables normalement distribuées:
- données: moyenne et sd pour le pourcentage d'azote et le pourcentage de carbone
- paramètre: rapport carbone / azote.
- l'inverse d'une variable normalement distribuée:
- données: masse / surface
- paramètre: surface / masse
Mon approche actuelle consiste à utiliser la simulation:
par exemple pour un ensemble de données de pourcentage de carbone et d'azote avec les moyennes: xbar.n, c, variance: se.n, c, et la taille de l'échantillon: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Je veux paramétrer ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Ensuite, choisissez les meilleures distributions d'ajustement avec la plage pour mon précédent
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Question: Est-ce une approche valable? Existe-t-il d'autres / meilleures approches?
Merci d'avance!
Hayya, J. et Armstrong, D. et Gressis, N., 1975. Une note sur le rapport de deux variables normalement distribuées. Science de la gestion 21: 1338-1341