Comprendre le paradoxe de Simpson: l'exemple d'Andrew Gelman avec la régression du revenu sur le sexe et la taille


22

Andrew Gelman dans l' un de ses récents articles de blog dit:

  1. Je ne pense pas que des contrefactuels ou des résultats potentiels soient nécessaires pour le paradoxe de Simpson. Je dis cela parce que l'on peut mettre en place le paradoxe de Simpson avec des variables qui ne peuvent pas être manipulées, ou pour lesquelles les manipulations ne sont pas directement d'intérêt.

  2. Le paradoxe de Simpson fait partie d'un problème plus général que les coefficients de régression changent si vous ajoutez plus de prédicteurs, le retournement de signe n'est pas vraiment nécessaire.

Voici un exemple que j'utilise dans mon enseignement qui illustre les deux points:

Je peux exécuter une régression prédisant le revenu du sexe et de la taille. Je trouve que le coef de sexe est de 10 000 $ (c'est-à-dire en comparant un homme et une femme de la même taille, en moyenne l'homme fera 10 000 $ de plus) et le coefficient de taille est de 500 $ (c'est-à-dire en comparant deux hommes ou deux femmes de différentes hauteurs, la personne la plus grande gagnera en moyenne 500 $ de plus par pouce de hauteur).

Comment puis-je interpréter ces coefs? Je pense que le coef de hauteur est facile à interpréter (il est facile d'imaginer comparer deux personnes du même sexe avec des hauteurs différentes), en effet il semblerait en quelque sorte «mauvais» de régresser sur la hauteur sans contrôler le sexe, autant de brut la différence entre les personnes de petite taille et de grande taille peut être «expliquée» par les différences entre les hommes et les femmes. Mais le coef de sexe dans le modèle ci-dessus semble très difficile à interpréter: pourquoi comparer un homme et une femme qui mesurent tous les deux 66 pouces, par exemple? Ce serait une comparaison d'un petit homme avec une grande femme. Tout ce raisonnement semble vaguement causal mais je ne pense pas qu'il soit logique d'y penser en utilisant des résultats potentiels.

J'y ai réfléchi (et même commenté le post) et je pense qu'il y a quelque chose qui mérite d'être compris avec plus de clarté ici.

Jusqu'à la partie sur l'interprétation du genre, tout va bien. Mais je ne vois pas quel est le problème derrière la comparaison d'un petit homme et d'une grande femme. Voici mon point: en fait, cela a encore plus de sens (étant donné l'hypothèse que les hommes sont plus grands en moyenne). Vous ne pouvez pas comparer un «homme court» et une femme «courte» pour exactement la même raison, car la différence de revenu s'explique en partie par la différence de hauteur. Il en va de même pour les hommes de grande taille et les femmes de grande taille et plus encore pour les femmes de petite taille et les hommes de grande taille (ce qui est plus hors de question, pour ainsi dire). Donc, fondamentalement, l'effet de la taille n'est éliminé que dans le cas où les hommes courts et les femmes grandes sont comparés (et cela aide à interpréter le coefficient sur le sexe). Cela ne fait-il pas penser à des concepts sous-jacents similaires derrière les modèles de correspondance populaires?

L'idée derrière le paradoxe de Simpson est que l'effet sur la population pourrait être différent de l'effet ou des effets sur les sous-groupes. Cela est en quelque sorte lié à son point 2 et au fait qu'il reconnaît que la hauteur ne doit pas être contrôlée pour lui seul (ce que nous disons omis le biais variable). Mais je ne pouvais pas relier cela à la controverse sur le coefficient de genre.

Peut-être pourriez-vous l'exprimer plus clairement? Ou commenter ma compréhension?


La validation croisée examine des sous-ensembles aléatoires de la population, essayant d'avoir un surajustement minimum et une meilleure généralisation.
EngrStudent

1
Si je comprends bien vos préoccupations, je pense que vous pourriez également tirer profit du paradoxe du Seigneur. @article {lord67, author = {Lord, FM}, title = {Un paradoxe dans l'interprétation des comparaisons de groupes}, journal = {Psychological Bulletin}, année = {1967}, volume = {68}, pages = {304- -305}, mots-clés = {changer les scores}} @article {lord69, auteur = {Lord, FM}, title = {Ajustements statistiques lors de la comparaison de groupes préexistants}, journal = {Psychological Bulletin}, année = {1969}, volume = {72}, pages = {336--337}, mots-clés = {modifier les scores}}
mdewey

1
Judea Pearl a récemment publié un autre article sur le paradoxe de Simpson . Je suis presque sûr qu'il n'est pas d'accord avec la présentation de Gelman. Pour une fois, le deuxième point n'est pas le "paradoxe". Le renversement des estimations en conséquence de ce que vous conditionnez est un fait mathématique. Ce qui le rend potentiellement paradoxal, c'est lorsque vous effectuez des interprétations causales des deux estimations. Deuxièmement, pourquoi cette restriction aux seules causes manipulables?
NRH

Réponses:


9

Je ne suis pas totalement sûr de votre question, mais je peux faire des remarques sur ses affirmations et votre confusion dans l'exemple de modèle.

Andrew ne sait pas très bien si l'intérêt scientifique réside dans l' association sexe-revenu ajustée en fonction de la taille ou l'association taille-revenu ajustée selon le sexe . Dans un cadre de modèle causal, le sexe provoque la taille mais la hauteur ne provoque pas le sexe. Donc, si nous voulons l'impact du sexe, l'ajustement pour la taille introduirait un biais de médiateur (peut-être aussi un biais de collisionneur, car les riches sont plus grands!). Je trouve cela déroutant et drôle quand je vois une recherche appliquée qui interprète l' autre"covariables" (facteurs de confusion et variables de précision) qui sont incluses dans un modèle. Ils sont absurdes, mais fournissent simplement une stratification adéquate pour faire la comparaison qui est nécessaire. Ajuster à la taille, si vous êtes intéressé par l'inférence sur les différences de revenu fondées sur le sexe, n'est pas la bonne chose à faire.

Je conviens que les contrefactuels ne sont pas nécessaires pour expliquer le paradoxe de Simpson. Ils peuvent être simplement un trait intrinsèque aux données. Je pense que les RR bruts et ajustés sont dans un certain sens corrects sans être causaux. C'est plus problématique, bien sûr, lorsque l' objectif est l'analyse causale, et un surajustement révèle des problèmes de non-effondrement (qui gonfle un OR) et de taille d'échantillon insuffisante.

Pour rappel aux lecteurs: le paradoxe de Simpson est un phénomène très spécifique qui se réfère à un cas dans lequel une association change de direction après avoir contrôlé une variable de confusion. Les données sur les admissions à Berkeley en étaient l'exemple motivant. Là, les RR bruts ont montré que les femmes étaient moins susceptibles d'être acceptées à Berkeley. Cependant, une fois stratifiés par département , les RR ont montré que les femmes étaient plus susceptibles d'être acceptées dans chaque département . Ils étaient tout simplement plus susceptibles de postuler aux départements difficiles qui rejetaient de nombreuses personnes.

Maintenant, dans la théorie de l'inférence causale, nous serions confus de concevoir que le département appliqué aux causes du genre. Le genre est intrinsèque, non? Eh bien, oui et non. Miettenen plaide pour une approche "base d'étude" de ces problèmes: qui est la population? Ce ne sont pas tous les étudiants éligibles, ce sont eux qui s'appliquent spécifiquement à Berkeley. Les départements les plus compétitifs ont attiré les femmes à postuler à Berkeley alors qu'elles ne l'auraient pas fait autrement. Pour se développer: une femme qui est profondément intelligente veut entrer dans le meilleur programme d'ingénierie, par exemple. Si Berkeley n'avait pas eu un excellent programme d'ingénierie, elle n'aurait pas postulé de toute façon à Berkeley, elle aurait postulé au MIT ou à CalPoly. Ainsi, dans cette optique, la population «étudiante candidate», le département est à l'origine du genre et est un facteur de confusion. (mise en garde: je suis un étudiant de première génération, donc je ne sais pas trop quels programmes sont renommés pour quoi).

Alors, comment résumons-nous ces données? Il est vrai que Berkeley était plus susceptible d'admettre un homme ayant postulé qu'une femme. Et il est vrai que les départements de Berkeley étaient plus susceptibles d'admettre des femmes que d'admettre des hommes. Les RR bruts et stratifiés sont des mesures raisonnables même s'ils ne sont pas causaux. Cela souligne combien il est important d'être précis avec notre formulation en tant que statisticiens (l'humble auteur ne se prétend pas à distance précis).

La confusion est un phénomène distinct de la non-effondrement, une autre forme de biais variable omis mais connu pour produire des effets plus doux sur les estimations. Contrairement à la régression logistique, la non-pliabilité ne provoque pas de biais dans la régression linéaire et la prise en compte d'un continu dans l'exemple de Gelman aurait dû être décrite plus en détail.

L'interprétation par Andrew du coefficient de sexe dans son modèle de revenu ajusté selon le sexe / la taille révèle la nature des hypothèses du modèle: l'hypothèse de linéarité. En effet dans le modèle linéaire, de telles comparaisons entre hommes et femmes sont possibles car pour une femme spécifique, on peut prédirece qu'un homme de taille similaire a pu gagner, même s'il n'a pas été observé. C'est également le cas si l'on permet une modification de l'effet, de sorte que la pente de la tendance chez les femmes est différente de celle des hommes. D'un autre côté, je ne pense pas que ce soit si fou de concevoir des hommes et des femmes de la même taille, 66 pouces en effet serait une grande femme et un petit homme. Cela me semble une légère projection plutôt qu'une extrapolation grossière. De plus, comme les hypothèses du modèle peuvent être énoncées clairement, cela aide les lecteurs à comprendre que l'association revenu-taille stratifiée selon le sexe contient des informations qui sont empruntées ou moyennées entredes échantillons de mâles et de femelles. Si une telle association faisait l'objet d'une inférence, le statisticien sérieux envisagerait évidemment la possibilité d'une modification de l'effet.


2
Grande discussion. En tant que statisticien, cela m'irrite sans fin lorsque les gens parlent des résultats d'une étude, mais ne savent pas s'ils parlent d'effets marginaux ou conditionnels.
Cliff AB

1

"Pourquoi comparer un homme et une femme qui mesurent tous les deux 66 pouces, par exemple? Ce serait une comparaison d'un homme court avec une femme grande "

Le modèle suppose que le revenu dépend du sexe et de la taille. Cependant, la façon dont la taille génère un revenu plus élevé peut ne pas être la même pour les hommes et les femmes. Les femmes peuvent être considérées comme grandes «assez» à une hauteur pour laquelle un homme peut toujours être considéré comme petit.

La simplification du modèle de la manière suivante peut être utile.

Supposons que vous vouliez régresser la probabilité d'être employé en tant qu'assistant dans les grands magasins de vêtements et envisagez la stratégie d'identification suivante.

Vous observez que les employeurs sont plus susceptibles d'embaucher des travailleurs qui atteignent une certaine taille minimale, où le «minimum» est relatif au sexe.

Au lieu de mesurer la taille en cm, supposons qu'il existe deux valeurs de seuil définissant à quelle hauteur respectivement un homme et une femme sont "grands":> = 180 cm pour les hommes et> = 170 cm pour les femmes.

En supposant que les seuils existent dans la réalité (c'est-à-dire que les employeurs font une réelle différence entre être une femme et mesurer 169 cm ou 171 cm), et qu'ils sont les bons, vous pouvez construire un mannequin définissant les hommes et les femmes grands / courts. Les hommes et les femmes de taille différente peuvent toujours appartenir à la même catégorie de votre mannequin et en même temps, votre mesure est conforme à la dynamique réelle de ce marché du travail particulier.


-1

Diriez-vous (en termes plus clairs) que la lutte de genre typique selon laquelle les hommes ont plus de chances que les femmes car leur revenu est supérieur de p% serait paradoxalement biaisée?

C'est peut-être un point. Nous avons tendance à voir les choses à quoi elles ressemblent et non à analyser les implications sous-jacentes.

pour aller au-dessus du paradoxe de Simpson, nous devons répondre à la question «combien d'argent de plus une femme fait-elle le même travail impartial par rapport à un homme? alors quelqu'un pourrait dire qu'elles doivent être enceintes et élever des enfants plus que leurs homologues, ce qui est vrai, mais l'important est qu'il est en quelque sorte soupiré juste pour dire, "les femmes pour le fait même d'être des femmes ont moins d'opportunités" et une profonde Une analyse avec des statistiques conditionnelles nous amènerait à voir qu'en substance, il y a généralement l'égalité des chances et que ce sont d'autres facteurs non liés au sexe qui font que les statistiques ressemblent à de la discrimination liée aux problèmes sexuels.


Il peut être utile de comprendre qu'une telle analyse n'est pas nécessairement causale ni explicative, mais descriptive d'un phénomène existant.
AdamO
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.