Dans la modélisation d'équations structurelles avec des variables latentes (SEM), une formulation de modèle courante est «indicateur multiple, cause multiple» (MIMIC) où une variable latente est causée par certaines variables et reflétée par d'autres. Voici un exemple simple:
Essentiellement, f1
est un résultat de régression pour x1
, x2
et x3
, et y1
, y2
et y3
sont des indicateurs de mesure pour f1
.
On peut également définir une variable latente composite, où la variable latente équivaut essentiellement à une combinaison pondérée de ses variables constituantes.
Voici ma question: existe-t-il une différence entre la définition f1
d'un résultat de régression et la définition d'un résultat composite dans un modèle MIMIC?
Certains tests utilisant un lavaan
logiciel R
montrent que les coefficients sont identiques:
library(lavaan)
# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))
# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
f1 =~ y1 + y2 + y3
f1 ~ x1 + x2 + x3
'
# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
f1 =~ y1 + y2 + y3
f1 <~ x1 + x2 + x3
'
# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)
# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"
Comment ces deux modèles sont-ils mathématiquement identiques? Ma compréhension est que les formules de régression dans un SEM sont fondamentalement différentes des formules composites, mais cette conclusion semble rejeter cette idée. De plus, il est facile de trouver un modèle où l' ~
opérateur n'est pas interchangeable avec l' <~
opérateur (pour utiliser lavaan
la syntaxe de). Habituellement, l'utilisation de l'un à la place de l'autre entraîne un problème d'identification du modèle, en particulier lorsque la variable latente est ensuite utilisée dans une formule de régression différente. Alors, quand sont-ils interchangeables et quand ne le sont-ils pas?
Le manuel de Rex Kline (Principes et pratique de la modélisation d'équations structurelles) a tendance à parler des modèles MIMIC avec la terminologie des composites, mais Yves Rosseel, l'auteur de lavaan
, utilise explicitement l'opérateur de régression dans chaque exemple MIMIC que j'ai vu.
Quelqu'un peut-il clarifier cette question?
f1 ~ x1 + x2 + x3
, mais vous pouvez avoirf1 <~ x1 + x2 + x3
?