Estimation des effets aléatoires et application d'une structure de corrélation / covariance définie par l'utilisateur avec le package R lme4 ou nlme


9

J'ai le type de données suivant. J'ai évalué 10 individus chacun répété 10 fois. J'ai une matrice de relations 10x10 (relation entre toutes les combinaisons des individus).

set.seed(1234)
mydata <- data.frame (gen = factor(rep(1:10, each = 10)),
                      repl = factor(rep(1:10, 10)),
                      yld = rnorm(10, 5, 0.5))

Cette génération est constituée de différentes variétés de plantes, chacune peut donc être cultivée à plusieurs reprises et le rendement est mesuré. La matrice de covariance est une mesure de parenté par similitude génétique calculée par les probabilités ibd dans des expériences séparées.

library(lme4)
covmat <- round(nearPD(matrix(runif(100, 0, 0.2), nrow = 10))$mat, 2)
diag(covmat) <- diag(covmat)/10+1
rownames(covmat) <- colnames(covmat) <- levels(mydata$gen)

> covmat                   
10 x 10 Matrix of class "dgeMatrix"                    
      1    2    3    4    5    6    7    8    9   10
1  1.00 0.08 0.06 0.03 0.09 0.09 0.10 0.08 0.07 0.10
2  0.08 1.00 0.08 0.09 0.04 0.12 0.08 0.08 0.11 0.09
3  0.06 0.08 1.00 0.10 0.05 0.09 0.09 0.07 0.04 0.13
4  0.03 0.09 0.10 1.00 0.02 0.11 0.09 0.06 0.04 0.12
5  0.09 0.04 0.05 0.02 1.00 0.06 0.07 0.05 0.02 0.08
6  0.09 0.12 0.09 0.11 0.06 1.00 0.12 0.08 0.07 0.14
7  0.10 0.08 0.09 0.09 0.07 0.12 1.00 0.08 0.03 0.15
8  0.08 0.08 0.07 0.06 0.05 0.08 0.08 1.00 0.06 0.09
9  0.07 0.11 0.04 0.04 0.02 0.07 0.03 0.06 1.00 0.03
10 0.10 0.09 0.13 0.12 0.08 0.14 0.15 0.09 0.03 1.00

Mon modèle est:

yld = gen + repl + error 

gen et repl sont considérés comme aléatoires et je veux obtenir les estimations de l'effet aléatoire associées à chaque génération, mais je dois prendre en compte la matrice de relation.

S'il est trop complexe pour s'adapter à des modèles imbriqués, je supprimerais simplement repl du modèle, mais idéalement je le garderai.

yld = gen +  error 

Comment puis-je y parvenir en utilisant des packages R, peut-être avec nlme ou lme4? Je sais qu'ASREML peut le faire mais je n'ai pas de prise et j'aime R pour être robuste aussi bien que gratuit.


1
Aaron, merci pour vos pensées, j'espère que vous obtiendrez une suggestion plus solide à ce sujet ...
Ram Sharma

L'exemple est extrêmement déroutant car il suggère fortement un autre type d'ensemble de données; cela contredit la question. Veuillez supprimer cet exemple ou en fournir un réaliste.
whuber

@whuber J'ai édité une partie de ma faute de frappe et clarifié mon point de vue, j'espère que ça aide
Ram Sharma

@RamSharma: J'ai pris la liberté de faire un échantillon de matrice de covariance définie positive, et j'ai fait quelques modifications mineures; n'hésitez pas à revenir en arrière si j'ai changé quelque chose d'important.
Aaron a quitté Stack Overflow

Je pense que nous devrions migrer cela vers stackoverflow, pour obtenir plus de vues. Je ne sais pas comment faire, quelqu'un peut-il m'aider?
John

Réponses:


6

Essayez le kinshippackage, qui est basé sur nlme. Voir ce fil sur les modèles r-sig-mixed-pour plus de détails. J'avais oublié cela alors que j'essayais de le faire pour un modèle logistique. Voir /programming/8245132 pour un exemple élaboré.

Pour les réponses non normales, vous devez modifier le package pedigreemm, qui est basé sur lme4. Cela vous rapproche, mais la matrice des relations doit être créée à partir d'un pedigree. La fonction ci-dessous est une modification de la pedigreemmfonction qui prend à la place une matrice de relation arbitraire.

library(pedigreemm)
relmatmm <- function (formula, data, family = NULL, REML = TRUE, relmat = list(), 
    control = list(), start = NULL, verbose = FALSE, subset, 
    weights, na.action, offset, contrasts = NULL, model = TRUE, 
    x = TRUE, ...) 
{
    mc <- match.call()
    lmerc <- mc
    lmerc[[1]] <- as.name("lmer")
    lmerc$relmat <- NULL
    if (!length(relmat)) 
        return(eval.parent(lmerc))
    stopifnot(is.list(relmat), length(names(relmat)) == length(relmat))
    lmerc$doFit <- FALSE
    lmf <- eval(lmerc, parent.frame())
    relfac <- relmat
    relnms <- names(relmat)
    stopifnot(all(relnms %in% names(lmf$FL$fl)))
    asgn <- attr(lmf$FL$fl, "assign")
    for (i in seq_along(relmat)) {
        tn <- which(match(relnms[i], names(lmf$FL$fl)) == asgn)
        if (length(tn) > 1) 
            stop("a relationship matrix must be associated with only one random effects term")
        Zt <- lmf$FL$trms[[tn]]$Zt
        relmat[[i]] <- Matrix(relmat[[i]][rownames(Zt), rownames(Zt)], 
            sparse = TRUE)
        relfac[[i]] <- chol(relmat[[i]])
        lmf$FL$trms[[tn]]$Zt <- lmf$FL$trms[[tn]]$A <- relfac[[i]] %*% Zt
    }
    ans <- do.call(if (!is.null(lmf$glmFit)) 
        lme4:::glmer_finalize
    else lme4:::lmer_finalize, lmf)
    ans <- new("pedigreemm", relfac = relfac, ans)
    ans@call <- match.call()
    ans
}

L'utilisation est similaire, pedigreemmsauf que vous lui donnez la matrice de relation comme relmatargument au lieu du pedigree comme pedigreeargument.

m <- relmatmm(yld ~ (1|gen) + (1|repl), relmat=list(gen=covmat), data=mydata)

Cela ne s'applique pas ici car vous avez dix observations / individu, mais pour une observation / individu, vous avez besoin d'une ligne de plus dans cette fonction et d'un patch mineur lme4pour ne permettre qu'une seule observation par effet aléatoire.


Que diriez-vous: lme (yld ~ 1, data = mydata, random = ~ gen + repl, correlation = covmat) # la formule donne et erreur et je ne suis pas sûr que si la structure de corrélation s'applique à la réplication ou au terme résiduel, que faire tu penses ?
John

@John: Les effets aléatoires croisés sont difficiles nlmeet quelque chose de plus compliqué est nécessaire gen + repl; aussi, je pense que la corrélation doit appeler une des fonctions nlmede covariance / corrélation avec covmatcomme paramètre. La notation pour cela est vraiment délicate, donc pour en dire plus, j'aurais besoin de Pinhiero / Bates, ce que je n'ai pas aujourd'hui.
Aaron a quitté Stack Overflow

alors s'il n'y a pas d'effet repl, pensez-vous que lme (yld ~ 1, data = mydata, random = ~ gen, correlation = covmat) est approprié ou équivalent au code asreml: asreml (yld ~ 1, random = ~ gen, ginverse = liste (gen = inv.covmat), data = mydata), où inv.covmat est la matrice fondue du triangle inférieur (voir la documentation asreml-r)
John

La bonne notation serait probablement quelque chose comme lme(yld ~ 1, data = mydata, random = ~ 1 | gen, correlation = corSymm(value=covmatX, form= ~ gen, fixed=TRUE)), où se covmatXtrouve une version modifiée de covmatpour qu'elle le corSymmveuille cependant . Je ne suis pas sûr non plus que le formterme soit correct.
Aaron a quitté Stack Overflow

@Aaron, avez-vous ce patch à portée de main? J'en aurais souvent besoin pour adapter un modèle avec un seul individu pour chaque classe ... Je pourrais vouloir poser une question distincte ... ce pourrait être trop dans cette question
Ram Sharma

4

Cette réponse est une extension potentielle de la suggestion faite par Aaron, qui a suggéré d'utiliser Pedigreem. Le pedigreem peut calculer la relation à partir des projets comme la syntaxe suivante, je ne sais pas comment nous pouvons utiliser une telle sortie de relation de manière différente.

# just example from the manual to create pedigree structure and relation matrix 
  # (although you have already the matrix in place) 
p1 <- new("pedigree",
sire = as.integer(c(NA,NA,1, 1,4,5)),
dam = as.integer(c(NA,NA,2,NA,3,2)),
label = as.character(1:6))
p1
(dtc <- as(p1, "sparseMatrix")) # T-inverse in Mrode’s notation
solve(dtc)
inbreeding(p1) 

L'ajustement de modèle mixte du package est basé sur lme4 car la syntaxe de la fonction principale est similaire à la fonction de package lme4, fonction lmer, sauf que vous pouvez y insérer l'objet pedigree.

pedigreemm(formula, data, family = NULL, REML = TRUE, pedigree = list(),
 control = list(),
start = NULL, verbose = FALSE, subset, weights, na.action, 
  offset, contrasts = NULL, model = TRUE, x = TRUE, ...)

Je sais que ce n'est pas la réponse parfaite à votre question, mais cela peut aider un peu. je suis content que vous ayez posé cette question qui m'intéresse!


1
Proposé par RamSharma: Solution en utilisant la parenté : require(kinship); model1 <- lmekin(yld ~1, random = ~ 1|gen, varlist =list(covmat), data=mydata).
chl

1
modifications supplémentaires à ma suggestion: model1 <- lmekin(yld ~1, random = ~ 1|gen, varlist =list(covmat), data=mydata)il y a toujours un problème, désolé pour une publication prématurée. Quelqu'un peut-il le réparer?
Ram Sharma

0

lmer()dans l' lme4emballage permet des effets aléatoires croisés. Ici, vous utiliseriez quelque chose comme

y ~ (1|gen) + (1|repl)

Pour une référence complète;

http://www.stat.wisc.edu/~bates/PotsdamGLMM/LMMD.pdf


3
oui, l'ajustement de l'effet aléatoire croisé n'est pas un problème seul, mais l'ajustement de la structure de co-variance définie par l'utilisateur est le problème principal et la question cherche principalement une réponse à cela.
John
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.