Effet marginal du modèle Probit et Logit

12

Quelqu'un peut-il expliquer comment calculer l'effet marginal du modèle Probit et Logit en termes simples?

Je suis nouveau dans les statistiques et je suis confus au sujet de ces deux modèles.

— marque
source

Notez que les nombres qui sortent des modèles Probit et Logit ont l'air de mesurer à peu près la même chose, mais sont souvent différents numériquement. Lorsque vous les traduisez dans la vraie vie, la différence entre les deux devient généralement beaucoup plus petite.

— Henry

15

Je pense qu'une meilleure façon de voir l'effet marginal d'une variable donnée, disons , est de produire un nuage de points de la probabilité prédite sur l'axe vertical et d'avoir sur l'axe horizontal. C'est la façon la plus "profane" que je puisse penser d'indiquer à quel point une variable donnée est influente. Pas de maths, juste des photos. Si vous avez beaucoup de points de données, un boxplot ou un nuage de points plus fluide peut aider à voir où se trouvent la plupart des données (par opposition à un simple nuage de points). $X_j$ $X_j$

Vous ne savez pas à quel point "Layman" est la section suivante, mais vous pouvez la trouver utile.

Si nous regardons l'effet marginal, appelons-le , notant que , nous obtenons $m_j$ $g(p)=\sum_kX_k\beta_k$

m_{j} = \frac{\partial p}{\partial X_{j}} = \frac{β_{j}}{g^{'} [g^{- 1} (X^{T} β)]} = \frac{β_{j}}{g^{'} (p)}

$m_j=\frac{\partial p}{\partial X_j}=\frac{\beta_j}{g'\left[g^{-1}(X^T\beta)\right]}=\frac{\beta_j}{g'(p)}$

L'effet marginal dépend donc de la probabilité estimée et du gradient de la fonction de liaison en plus du bêta. La division par , provient de la règle de chaîne pour la différenciation, et du fait que . Cela peut être démontré en différenciant les deux côtés de l'équation évidemment vraie . Nous avons aussi que par définition. Pour un modèle logit, nous avons , et l'effet marginal est: $g'(p)$ $\frac{\partial g^{-1}(z)}{\partial z}=\frac{1}{g'\left[g^{-1}(z)\right]}$ $z=g\left[g^{-1}(z)\right]$ $g^{-1}(X^T\beta)=p$ $g(p)=\log(p)-\log(1-p)\implies g'(p)=\frac{1}{p}+\frac{1}{1-p}=\frac{1}{p(1-p)}$

m_{j}^{l o g i t} = β_{j} p (1 - p)

$m_j^{logit}=\beta_jp(1-p)$

Qu'est-ce que ça veut dire? bien est nul à et à , et il atteint sa valeur maximale de à . L'effet marginal est donc le plus important lorsque la probabilité est proche de et le plus petit lorsque est proche de ou proche de . Cependant, dépend toujours de , donc les effets marginaux sont compliqués. En fait, comme cela dépend de , vous obtiendrez un effet marginal différent pour différents $p(1-p)$ $p=0$ $p=1$ $0.25$ $p=0.5$ $0.5$ $p$ $0$ $1$ $p(1-p)$ $X_j$ $p$ $X_k,\;k\neq j$ valeurs. Peut-être une bonne raison de simplement faire ce nuage de points simple - vous n'avez pas besoin de choisir les valeurs des covariables à utiliser.

Pour un modèle probit, nous avons où est le CDF normal standard et est le pdf normal standard. On obtient donc: $g(p)=\Phi^{-1}(p)\implies g'(p)=\frac{1}{\phi\left[\Phi^{-1}(p)\right]}$ $\Phi(.)$ $\phi(.)$

m_{j}^{p r o b i t} = β_{j} ϕ [Φ^{- 1} (p)]

$m_j^{probit}=\beta_j\phi\left[\Phi^{-1}(p)\right]$

Notez que cela a la plupart des propriétés que l' effet marginal j'ai discuté plus tôt, et est également vrai de toute fonction de lien qui est symétrique d'environ (et saine, bien sûr, par exemple ). La dépendance à est plus compliquée, mais a toujours la forme générale de "bosse" (point le plus haut à , le plus bas à et ). La fonction de lien changera la taille de la hauteur maximale (par exemple, le maximum de probit est , logit est ), et la vitesse à laquelle l'effet marginal est effilé vers zéro. $m_j^{logit}$ $0.5$ $g(p)=tan(\frac{\pi}{2}[2p-1])$ $p$ $0.5$ $0$ $1$ $\frac{1}{\sqrt{2\pi}}\approx 0.4$ $0.25$

— probabilitéislogique
source

Le effectspackage dans R peut facilement produire de tels tracés de probabilité prédite sur l'axe vertical vs X sur l'axe horizontal. Voir socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html

— landroni

Voir aussi: stats.stackexchange.com/questions/18814/…

— landroni

5

Les modèles logit et probit sont généralement utilisés pour déterminer une probabilité que la variable dépendante y soit 0 ou 1 sur la base d'un certain nombre de variables d'entrée.

En anglais: supposons que vous essayez de prédire une valeur binaire, par exemple si quelqu'un développera ou non une maladie cardiaque au cours de sa vie. Vous avez un certain nombre de variables d'entrée telles que la pression artérielle, l'âge, qu'ils fument ou non, leur IMC, leur lieu de résidence, etc. etc. Toutes ces variables peuvent contribuer d'une manière ou d'une autre aux risques de développer une maladie cardiaque.

L'effet marginal d'une seule variable d'entrée est que si vous augmentez légèrement cette variable, comment cela affecte-t-il la probabilité d'avoir une maladie cardiaque? Supposons que la pression artérielle augmente légèrement, comment cela change-t-il les chances d'avoir une maladie cardiaque? Ou si vous augmentez l'âge d'un an?

Certains de ces effets peuvent également être non linéaires: une légère augmentation de l'IMC peut avoir un effet très différent pour quelqu'un qui a un IMC très sain que pour quelqu'un qui n'en a pas.

— robbrit
source

1

Vous voudriez toujours que votre profane connaisse le calcul, car l'effet marginal est la dérivée d'une probabilité ajustée par rapport à la variable d'intérêt. La probabilité ajustée étant la fonction de lien (logit, probit ou autre) appliquée aux valeurs ajustées, vous avez besoin de la règle de chaîne pour la calculer. Ainsi, dans les modèles d'indices linéaires (où les paramètres entrent comme quelque chose comme X'b), il est égal à l'estimation des paramètres multipliée par la dérivée de la fonction de liaison. Comme la dérivée est différente à différentes valeurs des régresseurs (contrairement au cas d'un modèle linéaire), vous devez décider où évaluer l'effet marginal. Un choix naturel serait la valeur moyenne de tous les régresseurs. Une autre approche consisterait à évaluer l'effet pour chaque observation puis à en faire la moyenne. L'interprétation diffère en conséquence.

— Alex
source