Calcul de la taille de l'échantillon pour les modèles mixtes

23

Je me demande s'il existe des méthodes pour calculer la taille de l'échantillon dans les modèles mixtes? J'utilise lmeren R pour ajuster les modèles (j'ai des pentes et des interceptions aléatoires).

r mixed-model lme4-nlme power-analysis

— Nikita Kuznetsov
source

3

La simulation est toujours une option - c'est-à-dire simuler des données sous une hypothèse alternative particulière et une taille d'échantillon et réajuster le modèle plusieurs fois pour voir à quelle fréquence vous rejetez l'hypothèse nulle d'intérêt. D'après mon expérience, cela prend beaucoup de temps (informatique) car cela prend au moins quelques secondes pour chaque ajustement de modèle.

— Macro

29

Le longpowerpackage implémente les calculs de taille d'échantillon dans Liu et Liang (1997) et Diggle et al (2002). La documentation contient un exemple de code. En voici un, en utilisant la lmmpower()fonction:

> require(longpower)
> require(lme4)
> fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) 
> lmmpower(fm1, pct.change = 0.30, t = seq(0,9,1), power = 0.80)

     Power for longitudinal linear model with random slope (Edland, 2009) 

              n = 68.46972
          delta = 3.140186
         sig2.s = 35.07153
         sig2.e = 654.941
      sig.level = 0.05
              t = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
          power = 0.8
    alternative = two.sided
       delta.CI = 2.231288, 4.049084
           Days = 10.46729
        Days CI = 7.437625, 13.496947
           n.CI = 41.18089, 135.61202

Vérifiez également liu.liang.linear.power()qui " effectue le calcul de la taille de l'échantillon pour un modèle mixte linéaire"

Liu, G. et Liang, KY (1997). Calculs de taille d'échantillon pour les études avec observations corrélées. Biometrics, 53 (3), 937-47.

Diggle PJ, Heagerty PJ, Liang K, Zeger SL. Analyse des données longitudinales. Deuxième édition. Oxford. Serires des sciences statistiques. 2002

Edit: Une autre façon est de "corriger" l'effet du clustering. Dans un modèle linéaire ordinaire, chaque observation est indépendante, mais en présence de regroupements, les observations ne sont pas indépendantes, ce qui peut être considéré comme ayant moins d'observations indépendantes - la taille effective de l'échantillon est plus petite. Cette perte d'efficacité est connue sous le nom d'effet de conception :

ré E = 1 + (m - 1) ρ

$DE = 1 +(m-1)\rho$

m

$m$

ρ

$\rho$

D E

$DE$

— Robert Long
source

3

ré E F F = 1 + (m - 1) ρ_{X} ρ_{ϵ},

${\rm DEFF} = 1 + (m-1) \rho_x \rho_\epsilon,$

ρ_{x}

$\rho_x$

ρ_{ϵ}

$\rho_\epsilon$

Pouvez-vous m'indiquer une citation pour cette formule?

— Joshua Rosenberg

10

Pour quoi que ce soit au-delà des simples tests sur 2 échantillons, je préfère utiliser la simulation pour la taille de l'échantillon ou les études de puissance. Avec les routines préemballées, vous pouvez parfois voir de grandes différences entre les résultats des programmes en fonction des hypothèses qu'ils font (et vous ne pourrez peut-être pas savoir quelles sont ces hypothèses, et encore moins si elles sont raisonnables pour votre étude). Avec la simulation, vous contrôlez toutes les hypothèses.

Voici un lien vers un exemple:
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2009q1/001790.html

— Greg Snow
source

Je me demande simplement, cela fonctionne-t-il également pour les modèles GLMER?

— Charlie Glez

1

@CarlosGlez, oui, cela fonctionne pour tout modèle où vous pouvez simuler des données et les analyser. Je l'ai fait pour les modèles GLMER.

— Greg Snow

Bien dit, et j'ajouterai qu'en plus de "contrôler les hypothèses", vous pouvez également poser des questions "et si", briser ces hypothèses et déterminer un sens pratique de la robustesse, par exemple si des effets aléatoires non normaux ruinent vraiment l'efficacité.

— AdamO