Problème d'identification des paramètres

J'ai toujours du mal à obtenir la véritable essence de l'identification en économétrie. Je sais que nous déclarons qu'un paramètre (par exemple ) peut être identifié si, simplement en regardant sa distribution (conjointe), nous pouvons déduire la valeur du paramètre. Dans un cas simple de , où nous pouvons affirmer que est identifié si nous savons que sa variance . Mais que faire si où est un paramètre inconnu? Peut - et être identifiés? $\hat{\theta}$ $y=b_1X+u$ $E[u]=0,E[u|x]=0$ $b_1$ $Var(\hat{b})>0$ $E[u|X]=a$ $a$ $a$ $b_1$

Si le modèle à où et , pour montrer que sont identifiés, faites Je dois simplement réaffirmer que la variance pour les trois paramètres est supérieure à zéro? $Y=b_0+b_1X+b_2XD=u$ $D\in\{0,1\}$ $E[u|X,D]=0$ $b_1,b_2,b_3$

J'apprécie toute l'aide pour clarifier mon esprit concernant l'identification.

estimation identifiability

— CharlesM
source

On m'a dit que pour le modèle avec la variable fictive, je dois simplement montrer que existe ... ce qui signifie que les déterminants de cette matrice ne sont pas égaux à 0. Correct?

[X^{'} X]^{- 1}

$[X'X]^{-1}$

— CharlesM

J'ai aussi posté une question sur l'échange mathématique et rien ....

— CharlesM

Est-ce que cela aide ou simplement plus de ce que vous savez déjà? Notes de cours UChicago

— Kirk

Définissons d'abord les objets suivants: Dans un modèle statistique qui est utilisé pour modéliser en fonction de , il y a paramètres dénotés par le vecteur . Ces paramètres peuvent varier dans l'espace de paramètres . Nous ne sommes pas intéressés par l'estimation de tous ces paramètres, mais seulement d'un certain sous-ensemble, disons dans des paramètres que nous désignons et qui varient dans l'espace des paramètres . Dans notre modèle les variables et les paramètres $M$ $Y$ $X$ $p$ $\theta$ $\Theta \subset \mathbb{R^p}$ $q \leq p$ $\theta^0$ $\Theta^0 \subset \mathbb{R^q}$ $M$ $X$ $\theta$ va maintenant être mis en correspondance par exemple à expliquer . Ce mappage est défini par et les paramètres. $Y$ $M$

Dans ce contexte, l'identifiabilité en dit long sur l' équivalence observationnelle . En particulier, si les paramètres sont identifiables par rapport à alors il tiendra que . En d'autres termes, il n'existe pas un paramètre différent vecteur qui induisent le même procédé de génération de données, compte tenu de notre spécification du modèle . Pour rendre ces concepts plus imaginables, je donne deux exemples. $\theta^0$ $M$ $\nexists \theta^1 \in \Theta^0: \theta^1 \neq \theta^0, M(\theta^0) = M(\theta^1)$ $\theta^1$ $M$

Exemple 1 : définir pour ; le modèle statistique simple : et supposons que (donc ). Il est clair que si ou , il retiendra toujours que est identifiable: le processus générant partir de a une relation avec les paramètres et . Fixation $\theta = (a,b)$ $X\sim N(\mu, \sigma^2I_{n}); \varepsilon \sim N(0, \sigma_e^2 I_{n})$ $M$

\begin{aligned} Y = a + X b + ε \end{aligned}

$\begin{align} Y = a+Xb+\varepsilon \end{align}$

(a, b) \in R^{2}

$(a,b) \in \mathbb{R^2}$

Θ = R^{2}

$\Theta = \mathbb{R^2}$

θ^{0} = (a, b)

$\theta^0 = (a,b)$

θ^{0} = a

$\theta^0 = a$

θ^{0}

$\theta^0$

Y

$Y$

X

$X$

1 : 1

$1:1$

a

$a$

b

$b$

(a, b)

$(a,b)$ , il ne sera pas possible de trouver un second tuple dans décrivant le même processus de génération de données.

R

$\mathbb{R}$

Exemple 2 : définir pour ; le modèle statistique le plus délicat : et supposons que et (donc ). Alors que pour , ce serait un modèle statistique identifiable, cela ne vaut pas si l'on inclut un autre paramètre (c.-à-d. ou ). Pourquoi? Parce que pour toute paire de $\theta = (a,b,c)$ $X\sim N(\mu, \sigma^2I_{n}); \varepsilon \sim N(0, \sigma_e^2 I_{n})$ $M'$

\begin{aligned} Y = a + X (\frac{b}{c}) + ε \end{aligned}

$\begin{align} Y = a+X(\frac{b}{c})+\varepsilon \end{align}$

(a, b) \in R^{2}

$(a,b) \in \mathbb{R^2}$

c \in R ∖ {0}

$c \in \mathbb{R}\setminus\{0\}$

Θ = R^{3} ∖ {(l, m, 0) | (l, m) \in R^{2}}

$\Theta = \mathbb{R^3}\setminus\{(l,m,0)| (l,m) \in \mathbb{R^2}\}$

θ^{0}

$\theta^0$

b

$b$

c

$c$

(b, c)

$(b,c)$ , il existe une infinité d'autres paires dans l'ensemble . La solution évidente au problème dans ce cas serait d'introduire un nouveau paramètre remplaçant la fraction pour identifier le modèle. Cependant, on pourrait être intéressé par et tant que paramètres séparés pour des raisons théoriques - les paramètres pourraient correspondre à des paramètres d'intérêt au sens de la théorie (économique). (Par exemple, pourrait être la «propension à consommer» et pourrait être la «confiance», et vous pourriez vouloir estimer ces deux quantités à partir de votre modèle de régression. Malheureusement, cela ne serait pas possible.)

B := {(x, y) | (x / y) = (b / c), (x, y) \in R^{2}}

$B:=\{(x,y)|(x/y) = (b/c), (x,y)\in\mathbb{R}^2\}$

d = b / c

$d = b/c$

b

$b$

c

$c$

b

$b$

c

$c$

— Jeremias K
source

"Il n'existe pas de vecteur de paramètre différent qui générerait les mêmes données" ne semble pas tout à fait correct, sauf si vous entendez quelque chose d'inhabituel par "générer". Peut-être que cela doit être précisé ou peut-être que votre signification de «modèle statistique» doit être explicite. Dans la plupart des modèles, y compris ceux que vous utilisez dans vos illustrations, tout ensemble de données aurait pu être produit par l' un des paramètres possibles.

θ^{1}

$\theta^1$

— whuber

@whuber c'est un bon point. Ce que j'aurais dû dire, c'est qu '"il n'y a pas ... cela induirait le même processus de génération de données ". J'ai changé cela maintenant :)

— Jeremias K