Définissons d'abord les objets suivants: Dans un modèle statistique qui est utilisé pour modéliser en fonction de , il y a paramètres dénotés par le vecteur . Ces paramètres peuvent varier dans l'espace de paramètres . Nous ne sommes pas intéressés par l'estimation de tous ces paramètres, mais seulement d'un certain sous-ensemble, disons dans des paramètres que nous désignons et qui varient dans l'espace des paramètres . Dans notre modèle les variables et les paramètresMYXpθΘ⊂Rpq≤pθ0Θ0⊂RqMXθ va maintenant être mis en correspondance par exemple à expliquer . Ce mappage est défini par et les paramètres.YM
Dans ce contexte, l'identifiabilité en dit long sur l' équivalence observationnelle . En particulier, si les paramètres sont identifiables par rapport à alors il tiendra que . En d'autres termes, il n'existe pas un paramètre différent vecteur qui induisent le même procédé de génération de données, compte tenu de notre spécification du modèle . Pour rendre ces concepts plus imaginables, je donne deux exemples.θ0M∄θ1∈Θ0:θ1≠θ0,M(θ0)=M(θ1)θ1M
Exemple 1 : définir pour ; le modèle statistique simple :
et supposons que (donc ). Il est clair que si ou , il retiendra toujours que est identifiable: le processus générant partir de a une relation avec les paramètres et . Fixationθ=(a,b)X∼N(μ,σ2In);ε∼N(0,σ2eIn)M
Y=a+Xb+ε
(a,b)∈R2Θ=R2θ0=(a,b)θ0=aθ0YX1:1ab(a,b) , il ne sera pas possible de trouver un second tuple dans décrivant le même processus de génération de données.
R
Exemple 2 : définir pour ; le modèle statistique le plus délicat :
et supposons que et (donc ). Alors que pour , ce serait un modèle statistique identifiable, cela ne vaut pas si l'on inclut un autre paramètre (c.-à-d. ou ). Pourquoi? Parce que pour toute paire deθ=(a,b,c)X∼N(μ,σ2In);ε∼N(0,σ2eIn)M′
Y=a+X(bc)+ε
(a,b)∈R2c∈R∖{0}Θ=R3∖{(l,m,0)|(l,m)∈R2}θ0bc(b,c), il existe une infinité d'autres paires dans l'ensemble . La solution évidente au problème dans ce cas serait d'introduire un nouveau paramètre remplaçant la fraction pour identifier le modèle. Cependant, on pourrait être intéressé par et tant que paramètres séparés pour des raisons théoriques - les paramètres pourraient correspondre à des paramètres d'intérêt au sens de la théorie (économique). (Par exemple, pourrait être la «propension à consommer» et pourrait être la «confiance», et vous pourriez vouloir estimer ces deux quantités à partir de votre modèle de régression. Malheureusement, cela ne serait pas possible.)
B:={(x,y)|(x/y)=(b/c),(x,y)∈R2}d=b/cbcbc