Sommaire
Le modèle simple selon lequel toutes les naissances, indépendamment l'une de l'autre, ont 50% de chances d'être des filles est irréaliste et, en fin de compte, exceptionnel. Dès que nous considérons les conséquences de la variation des résultats parmi la population, la réponse est que le rapport filles: garçons peut être n’importe quelle valeur ne dépassant pas 1: 1. (En réalité, il serait probablement encore proche de 1: 1, mais c'est une question d'analyse de données à déterminer.)
Parce que ces deux réponses contradictoires sont obtenues en supposant l'indépendance statistique des résultats de naissance, un appel à l'indépendance est une explication insuffisante. Il apparaît donc que la variation (dans les chances de naissance d'une femme) est l'idée clé du paradoxe.
introduction
Un paradoxe se produit lorsque nous pensons avoir de bonnes raisons de croire quelque chose, mais que nous sommes confrontés à un argument solide qui montre le contraire.
Une solution satisfaisante à un paradoxe nous aide à comprendre à la fois ce qui était correct et ce qui aurait pu être faux sur les deux arguments. Comme c'est souvent le cas dans les probabilités et les statistiques, les deux arguments peuvent en réalité être valides: la résolution dépendra des différences implicites entre les hypothèses . La comparaison de ces différentes hypothèses peut nous aider à identifier les aspects de la situation qui conduisent à des réponses différentes. Je maintiens que l’identification de ces aspects est ce qui nous importe le plus.
Hypothèses
Comme le prouvent toutes les réponses publiées jusqu'à présent, il est naturel de supposer que les naissances féminines se produisent indépendamment et avec des probabilités constantes de . Il est bien connu qu'aucune des hypothèses n'est en réalité vraie, mais il semblerait que de légers écarts par rapport à ces hypothèses ne devraient pas affecter beaucoup la réponse. Voyons. À cette fin, considérons le modèle plus général et plus réaliste suivant:1/2
Dans chaque famille la probabilité d'une naissance féminine est une constante , quel que soit l' ordre de naissance.ipi
En l’absence de règle d’arrêt, le nombre prévu de naissances féminines dans la population devrait être proche du nombre prévu de naissances masculines.
Tous les résultats de la naissance sont indépendants (statistiquement).
Ce n’est pas encore un modèle totalement réaliste de naissances humaines, dans lequel le peut varier en fonction de l’âge des parents (en particulier de la mère). Cependant, il est suffisamment réaliste et flexible pour permettre une résolution satisfaisante du paradoxe qui s’appliquera même à des modèles plus généraux.pi
Une analyse
Bien qu’il soit intéressant de procéder à une analyse approfondie de ce modèle, les points principaux deviennent évidents même lorsqu’une version spécifique, simple (mais un peu extrême) est envisagée. Supposons que la population compte familles. Dans la moitié de ces cas, les chances de naissance d'une femme sont de et dans l'autre moitié, les chances de naissance d'une femme sont de . Cela répond clairement à la condition (2): les nombres attendus de naissances féminines et masculines sont les mêmes.2N2/31/3
Considérons ces premières familles. Raisons raisonner en termes d'attentes, sachant que les résultats réels seront aléatoires et varieront donc un peu des attentes. (L'idée qui sous-tend l'analyse suivante a été exprimée plus brièvement et simplement dans la réponse originale qui apparaît à la toute fin de ce message.)N
Soit le nombre attendu de naissances féminines dans une population de avec une probabilité de naissance féminine constante . Évidemment , cela est proportionnelle à et si on peut écrire . De même, supposons que soit le nombre attendu de naissances masculines.f(N,p)NpNf(N,p)=f(p)Nm(p)N
Les premières familles produisent une fille et s'arrêtent. Les autres familles ont un garçon et continuent d'avoir des enfants. C'est filles et garçons jusqu'à présent.pN(1−p)NpN(1−p)N
Les familles restantes sont dans la même situation qu'auparavant:(1−p)N l'hypothèse d'indépendance (3) implique que ce qu'elles vivent dans le futur n'est pas affecté par le fait que leur premier-né était un fils. Ainsi, ces familles produiront plus de filles plus de garçons .f(p)[(1−p)N]m(p)[(1−p)N]
En additionnant le nombre total de filles et de garçons et en comparant à leurs valeurs supposées de et obtient des équations.f(p)Nm(p)N
f(p)N=pN+f(p)(1−p)N and m(p)N=(1−p)N+m(p)(1−p)N
avec des solutions
f(p)=1 and m(p)=1p−1.
Le nombre attendu de filles dans les premières familles , avec , est donc et le nombre attendu de garçons est .Np=2/3f(2/3)N=Nm(2/3)N=N/2
Le nombre attendu de filles dans les secondes familles , avec , est donc et le nombre attendu de garçons est .Np=1/3f(1/3)N=Nm(1/3)N=2N
Les totaux sont filles et garçons. Pour le grand le ratio attendu sera proche du ratio des attentes,(1+1)N=2N(1/2+2)N=(5/2)NN
E(# girls# boys)≈2N(5/2)N=45.
La règle d'arrêt favorise les garçons!
Plus généralement, avec la moitié des familles ayant des filles indépendamment avec la probabilité et l’autre moitié ayant des garçons indépendamment avec la probabilité , les conditions (1) à (3) continuent de s’appliquer et le ratio attendu pour les grandes approches dep1−pN
2p(1−p)1−2p(1−p).
En fonction de , qui est bien sûr compris entre et , cette valeur peut être comprise entre et (mais jamais supérieure à ). Il n'atteint son maximum de que lorsque . En d’autres termes, un ratio filles / garçons escompté de 1: 1 est une exception particulière à la règle plus générale et réaliste voulant que s’arrêter avec la première fille favorise un plus grand nombre de garçons dans la population.0 1 0 1 1 1 p = 1 / 2p010111p=1/2
Résolution
Si votre intuition est que si vous arrêtez avec la première fille devrait produire plus de garçons dans la population, alors vous avez raison, comme le montre cet exemple. Pour être correct, tout ce dont vous avez besoin, c'est que la probabilité de donner naissance à une fille varie (même légèrement) entre les familles.
La réponse "officielle", selon laquelle le rapport devrait être proche de 1: 1, nécessite plusieurs hypothèses irréalistes et y est sensible: cela suppose qu'il ne peut y avoir de variation entre les familles et que toutes les naissances doivent être indépendantes.
commentaires
L'idée clé mise en évidence par cette analyse est que la variation au sein de la population a des conséquences importantes. L'indépendance des naissances - bien que ce soit une hypothèse simplificatrice utilisée pour chaque analyse de ce fil - ne résout pas le paradoxe, car (selon les autres hypothèses), elle est cohérente à la fois avec la réponse officielle et son contraire.
Notez cependant que pour que le ratio attendu s'écarte sensiblement de 1: 1, il faut beaucoup de variation parmi les de la population. Si tous les sont, par exemple, compris entre 0,45 et 0,55, les effets de cette variation ne seront pas très perceptibles. Aborder cette question de ce que sont réellement les dans une population humaine nécessite un ensemble de données assez volumineux et précis. On pourrait utiliser un modèle mixte linéaire généralisé et tester la surdispersion .p i p ipipipi
Si nous remplaçons le genre par une autre expression génétique, nous obtiendrons alors une explication statistique simple de la sélection naturelle : une règle qui limite de manière différenciée le nombre de descendants en fonction de leur constitution génétique peut modifier systématiquement les proportions de ces gènes dans la génération suivante. Lorsque le gène n'est pas lié au sexe, même un faible effet sera multiplié par multiplication sur des générations successives et peut rapidement devenir considérablement amplifié.
Réponse originale
Chaque enfant a un ordre de naissance: premier-né, deuxième-né, etc.
En supposant des probabilités égales de naissances masculines et féminines et aucune corrélation entre les sexes, la loi sur les grands nombres faibles affirme qu'il y aura un ratio de près de 1: 1 entre les femmes premier - né et les hommes. Pour la même raison, il y aura un ratio proche de 1: 1 de femmes nées en deuxième naissance par rapport aux hommes, etc. Étant donné que ces ratios sont constamment de 1: 1, le ratio global doit également être de 1: 1, quelles que soient les fréquences relatives des ordres de naissance dans la population.