Nombre attendu de ratio filles / garçons à la naissance


45

Je suis tombé sur une question lors d'un test d'aptitude à l'entretien critique lors d'un entretien d'embauche. C'est quelque chose comme ça:

La République Zorganienne a des coutumes très étranges. Les couples souhaitent seulement avoir des enfants de sexe féminin, car seules les femmes peuvent hériter de la richesse de la famille. Par conséquent, s'ils ont un enfant de sexe masculin, ils continuent d'avoir plus d'enfants jusqu'à ce qu'ils aient une fille. S'ils ont une fille, ils cessent d'avoir des enfants. Quel est le ratio filles / garçons à Zorgania?

Je ne suis pas d'accord avec le modèle de réponse donné par l'auteur de la question, qui est d'environ 1: 1. La justification est que toute naissance aura toujours 50% de chances d'être un homme ou une femme.

Pouvez-vous me convaincre avec une réponse plus mathématique plus vigoureuse de E[G]:E[B] si G est le nombre de filles et B le nombre de garçons dans le pays?


3
Vous êtes correct dans votre désaccord avec la réponse type parce que le ratio M: F des naissances est différent du ratio M: F des enfants. Dans les sociétés humaines réelles, les couples qui souhaitent n'avoir que des enfants de sexe féminin auront probablement recours à des moyens tels que l'infanticide ou l'adoption étrangère pour se débarrasser des enfants de sexe masculin, ce qui donnera un ratio M: F inférieur à 1: 1.
Gabe

10
@Gabe Il n'y a aucune mention d'infanticide dans la question, il s'agit d'un exercice mathématique par opposition à une analyse sérieuse d'un pays réel où le meurtre est un lieu banal. De même, le rapport réel entre les naissances des garçons et des filles est plus proche de 51:49 (sans tenir compte des facteurs sociaux)
Richard Tingle le

2
Grâce aux réponses, je comprends maintenant pourquoi le rapport serait de 1: 1, ce qui parait à l’origine peu intuitif pour moi. Une des raisons de mon incrédulité et de ma confusion est que, je sais que les villages en Chine ont les problèmes opposés de la trop grande proportion de garçons: le ratio filles. Je peux voir que de manière réaliste, les couples ne pourront pas continuer à procréer indéfiniment tant qu'ils n'auront pas le sexe de l'enfant souhaité. En Chine, la loi n'autorise que 2 enfants maximum pour les habitants des zones rurales. Dans ce cas, le ratio sera plus proche de 3: 2 que de 1: 1.
Pizza Mobius

4
@MobiusPizza: Non, le ratio est de 1: 1, peu importe le nombre d'enfants que vous avez! La raison pour laquelle la Chine a un ratio différent est due à des facteurs sociaux tels que l'infanticide, l'avortement sélectif selon le sexe et l'adoption étrangère.
Gabe

3
@newmount Les simulations sont bonnes, mais elles ne représentent que les hypothèses qu'elles contiennent. Afficher uniquement le code, sans aucune explication, rend difficile l'identification des hypothèses par les utilisateurs. En l'absence d'une telle justification et explication, aucune quantité de sortie de simulation ne traitera la question ici. En ce qui concerne le "monde réel", quiconque revendique cette affirmation devra le fournir à l'aide de données sur les naissances humaines.
whuber

Réponses:


46

Commencez sans enfants

répéter l'étape

{

Chaque couple qui a encore des enfants a un enfant. La moitié des couples ont des hommes et la moitié des couples ont des femmes.

Les couples qui ont des femmes cessent d'avoir des enfants

}

A chaque étape, vous obtenez un nombre pair d'hommes et de femmes et le nombre de couples ayant des enfants est réduit de moitié (c'est-à-dire que ceux avec des femmes n'auront aucun enfant à l'étape suivante)

Donc, à tout moment, vous avez un nombre égal d'hommes et de femmes et, étape après étape, le nombre de couples ayant des enfants diminue de moitié. Alors que plus de couples sont créés, la même situation se reproduit et toutes choses étant égales par ailleurs, la population contiendra le même nombre d'hommes et de femmes.


6
Je pense que c'est un excellent moyen d'expliquer la distribution de probabilité sans s'appuyer sur une preuve mathématique rigoureuse.
LBushkin

1
Ce qui me plait, c’est que cela explique également ce qui est arrivé aux filles excédentaires attendues par votre intuition: les filles excédentaires sont désirées par les parents (ce sont les parents qui essaient à nouveau), mais ces parents (dans l’ensemble) ne créent jamais avec succès les filles.
Ben Jackson

2
Vous pouvez simplifier encore davantage en disant "répéter l'étape {quelqu'un décide s'il veut ou non avoir un enfant}". Les règles selon lesquelles ils décident sont totalement hors de propos à condition que tout le monde produise des garçons et des filles indépendamment avec la même probabilité. Il n'est même pas nécessaire de supposer une valeur pour cette probabilité, vous pouvez simplement dire que la fréquence dans la population sera la même que celle à la naissance.
Steve Jessop

1
@martino Je ne crois pas que ce soit le cas, bien que je ne serais pas surpris qu'il y ait des calculs très convaincants à cet effet. Je pense que ce scénario conduit à une rupture de notre notion de ratios, car le nombre d'enfants attendu par famille est infini. Vous devriez être sceptique quant à votre réponse en raison de la généralité avec laquelle les gens ont répondu à votre question dans ce fil.
jlimahaverford

1
@ martino. Pour le plaisir, je viens de lancer une simulation avec ce critère d’arrêt. 10 000 familles comptaient au total 160 693 469 garçons (et ce nombre plus 10 000 autres filles) pour un ratio de 0,9999377735896915. Des trucs incroyables.
jlimahaverford

37

Soit le nombre de garçons dans une famille. Dès qu'ils ont une fille, ils s'arrêtent, alorsX

X=0if the first child was a girlX=1if the first child was a boy and the second was a girlX=2if the first two children were boys and the third was a girland so on

Si est la probabilité qu'un enfant soit un garçon et si les sexes sont indépendants entre les enfants, la probabilité qu'une famille finisse par avoir garçons est de c’est-à-dire la probabilité d’avoir garçons puis d’avoir une fille. Le nombre attendu de garçons est Notant que nous obtenons k P ( X = k ) = p k( 1 - p ) , k E X = Σ k = 0 k p k( 1 - p ) = Σ k = 0 k p k - Σ k = 0 k p k + 1 . Σ k =pk

P(X=k)=pk(1p),
k
EX=k=0kpk(1p)=k=0kpkk=0kpk+1.
Σ k = 0 kpk-Σ k = 0 kp k + 1 =Σ k = 0 (k+1)p k + 1 -Σ k = 0 kp
k=0kpk=k=0(k+1)pk+1
Σk = 0 pk=1/(1-p)0<p<1
k=0kpkk=0kpk+1=k=0(k+1)pk+1k=0kpk+1=k=0pk+1=pk=0pk=p1p
où nous avons utilisé que lorsque (voir série géométrique ).k=0pk=1/(1p)0<p<1

Si , nous avons ce . C'est-à-dire que la famille moyenne a 1 garçon. Nous savons déjà que toutes les familles ont 1 fille, de sorte que le rapport sera même à terme de .E X = 0,5 / 0,5 1 / 1 = 1p=1/2EX=0.5/0.51/1=1

La variable aléatoire est appelée variable aléatoire géométrique .X


4
Ceci, bien sûr, suppose que pc'est la même chose pour toutes les familles. Si au contraire nous supposons que certains couples sont plus susceptibles d'avoir des garçons que d'autres ( c'est-à - dire que leur nombre pest plus élevé), le résultat change, même si la valeur moyennep est de 0,5. (C'est quand même une excellente explication des statistiques de base sous-jacentes.)
Ben Hocking

2
@Ben Votre commentaire contient une idée principale. La même chose m’était venue à l’esprit, j’ai donc modifié ma question pour y inclure une analyse de cette situation plus réaliste. Cela montre que le rapport limite n'est pas nécessairement 1: 1.
whuber

1
@BenHocking en effet! Et comme nous le savons à la fois dans les statistiques modernes et dans l’analyse classique des taux de natalité de Laplace, n’est pas vraiment égal à toute façon. :)une / deuxp1/2
mardi

21

Sommaire

Le modèle simple selon lequel toutes les naissances, indépendamment l'une de l'autre, ont 50% de chances d'être des filles est irréaliste et, en fin de compte, exceptionnel. Dès que nous considérons les conséquences de la variation des résultats parmi la population, la réponse est que le rapport filles: garçons peut être n’importe quelle valeur ne dépassant pas 1: 1. (En réalité, il serait probablement encore proche de 1: 1, mais c'est une question d'analyse de données à déterminer.)

Parce que ces deux réponses contradictoires sont obtenues en supposant l'indépendance statistique des résultats de naissance, un appel à l'indépendance est une explication insuffisante. Il apparaît donc que la variation (dans les chances de naissance d'une femme) est l'idée clé du paradoxe.

introduction

Un paradoxe se produit lorsque nous pensons avoir de bonnes raisons de croire quelque chose, mais que nous sommes confrontés à un argument solide qui montre le contraire.

Une solution satisfaisante à un paradoxe nous aide à comprendre à la fois ce qui était correct et ce qui aurait pu être faux sur les deux arguments. Comme c'est souvent le cas dans les probabilités et les statistiques, les deux arguments peuvent en réalité être valides: la résolution dépendra des différences implicites entre les hypothèses . La comparaison de ces différentes hypothèses peut nous aider à identifier les aspects de la situation qui conduisent à des réponses différentes. Je maintiens que l’identification de ces aspects est ce qui nous importe le plus.

Hypothèses

Comme le prouvent toutes les réponses publiées jusqu'à présent, il est naturel de supposer que les naissances féminines se produisent indépendamment et avec des probabilités constantes de . Il est bien connu qu'aucune des hypothèses n'est en réalité vraie, mais il semblerait que de légers écarts par rapport à ces hypothèses ne devraient pas affecter beaucoup la réponse. Voyons. À cette fin, considérons le modèle plus général et plus réaliste suivant:1/2

  1. Dans chaque famille la probabilité d'une naissance féminine est une constante , quel que soit l' ordre de naissance.ipi

  2. En l’absence de règle d’arrêt, le nombre prévu de naissances féminines dans la population devrait être proche du nombre prévu de naissances masculines.

  3. Tous les résultats de la naissance sont indépendants (statistiquement).

Ce n’est pas encore un modèle totalement réaliste de naissances humaines, dans lequel le peut varier en fonction de l’âge des parents (en particulier de la mère). Cependant, il est suffisamment réaliste et flexible pour permettre une résolution satisfaisante du paradoxe qui s’appliquera même à des modèles plus généraux.pi

Une analyse

Bien qu’il soit intéressant de procéder à une analyse approfondie de ce modèle, les points principaux deviennent évidents même lorsqu’une version spécifique, simple (mais un peu extrême) est envisagée. Supposons que la population compte familles. Dans la moitié de ces cas, les chances de naissance d'une femme sont de et dans l'autre moitié, les chances de naissance d'une femme sont de . Cela répond clairement à la condition (2): les nombres attendus de naissances féminines et masculines sont les mêmes.2N2/31/3

Considérons ces premières familles. Raisons raisonner en termes d'attentes, sachant que les résultats réels seront aléatoires et varieront donc un peu des attentes. (L'idée qui sous-tend l'analyse suivante a été exprimée plus brièvement et simplement dans la réponse originale qui apparaît à la toute fin de ce message.)N

Soit le nombre attendu de naissances féminines dans une population de avec une probabilité de naissance féminine constante . Évidemment , cela est proportionnelle à et si on peut écrire . De même, supposons que soit le nombre attendu de naissances masculines.f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • Les premières familles produisent une fille et s'arrêtent. Les autres familles ont un garçon et continuent d'avoir des enfants. C'est filles et garçons jusqu'à présent.pN(1p)NpN(1p)N

  • Les familles restantes sont dans la même situation qu'auparavant:(1p)N l'hypothèse d'indépendance (3) implique que ce qu'elles vivent dans le futur n'est pas affecté par le fait que leur premier-né était un fils. Ainsi, ces familles produiront plus de filles plus de garçons .f(p)[(1p)N]m(p)[(1p)N]

En additionnant le nombre total de filles et de garçons et en comparant à leurs valeurs supposées de et obtient des équations.f(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

avec des solutions

f(p)=1  and  m(p)=1p1.

Le nombre attendu de filles dans les premières familles , avec , est donc et le nombre attendu de garçons est .Np=2/3f(2/3)N=Nm(2/3)N=N/2

Le nombre attendu de filles dans les secondes familles , avec , est donc et le nombre attendu de garçons est .Np=1/3f(1/3)N=Nm(1/3)N=2N

Les totaux sont filles et garçons. Pour le grand le ratio attendu sera proche du ratio des attentes,(1+1)N=2N(1/2+2)N=(5/2)NN

E(# girls# boys)2N(5/2)N=45.

La règle d'arrêt favorise les garçons!

Plus généralement, avec la moitié des familles ayant des filles indépendamment avec la probabilité et l’autre moitié ayant des garçons indépendamment avec la probabilité , les conditions (1) à (3) continuent de s’appliquer et le ratio attendu pour les grandes approches dep1pN

2p(1p)12p(1p).

En fonction de , qui est bien sûr compris entre et , cette valeur peut être comprise entre et (mais jamais supérieure à ). Il n'atteint son maximum de que lorsque . En d’autres termes, un ratio filles / garçons escompté de 1: 1 est une exception particulière à la règle plus générale et réaliste voulant que s’arrêter avec la première fille favorise un plus grand nombre de garçons dans la population.0 1 0 1 1 1 p = 1 / 2p010111p=1/2

Résolution

Si votre intuition est que si vous arrêtez avec la première fille devrait produire plus de garçons dans la population, alors vous avez raison, comme le montre cet exemple. Pour être correct, tout ce dont vous avez besoin, c'est que la probabilité de donner naissance à une fille varie (même légèrement) entre les familles.

La réponse "officielle", selon laquelle le rapport devrait être proche de 1: 1, nécessite plusieurs hypothèses irréalistes et y est sensible: cela suppose qu'il ne peut y avoir de variation entre les familles et que toutes les naissances doivent être indépendantes.

commentaires

L'idée clé mise en évidence par cette analyse est que la variation au sein de la population a des conséquences importantes. L'indépendance des naissances - bien que ce soit une hypothèse simplificatrice utilisée pour chaque analyse de ce fil - ne résout pas le paradoxe, car (selon les autres hypothèses), elle est cohérente à la fois avec la réponse officielle et son contraire.

Notez cependant que pour que le ratio attendu s'écarte sensiblement de 1: 1, il faut beaucoup de variation parmi les de la population. Si tous les sont, par exemple, compris entre 0,45 et 0,55, les effets de cette variation ne seront pas très perceptibles. Aborder cette question de ce que sont réellement les dans une population humaine nécessite un ensemble de données assez volumineux et précis. On pourrait utiliser un modèle mixte linéaire généralisé et tester la surdispersion .p i p ipipipi

Si nous remplaçons le genre par une autre expression génétique, nous obtiendrons alors une explication statistique simple de la sélection naturelle : une règle qui limite de manière différenciée le nombre de descendants en fonction de leur constitution génétique peut modifier systématiquement les proportions de ces gènes dans la génération suivante. Lorsque le gène n'est pas lié au sexe, même un faible effet sera multiplié par multiplication sur des générations successives et peut rapidement devenir considérablement amplifié.


Réponse originale

Chaque enfant a un ordre de naissance: premier-né, deuxième-né, etc.

En supposant des probabilités égales de naissances masculines et féminines et aucune corrélation entre les sexes, la loi sur les grands nombres faibles affirme qu'il y aura un ratio de près de 1: 1 entre les femmes premier - né et les hommes. Pour la même raison, il y aura un ratio proche de 1: 1 de femmes nées en deuxième naissance par rapport aux hommes, etc. Étant donné que ces ratios sont constamment de 1: 1, le ratio global doit également être de 1: 1, quelles que soient les fréquences relatives des ordres de naissance dans la population.


Intéressant; cela semble être dû au fait qu’aucune règle ne peut modifier le ratio par rapport au ratio naturel, elle peut également modifier le nombre d’enfants résultants et que le nombre d’enfants dépend du ratio naturel. Ainsi, dans votre exemple, vous avez deux populations de parents et ils sont affectés différemment. (Cela dit, cela ressemble à une situation sortant du cadre du pays fictif implicite, qui est plutôt un exercice mathématique)
Richard Tingle

@ Richard Cela pourrait sembler juste parce que, par souci d'exposé, j'ai trop simplifié. En réalité, on modéliserait la population avec une distribution de ayant une moyenne de . À moins que la variance de cette distribution ne soit nulle, la même analyse implique les mêmes conclusions, y compris que le rapport fille: garçon attendu sera strictement inférieur à . Cela montre que la conclusion populaire (que le rapport doit être de 1: 1) dépend essentiellement de l'hypothèse de non-variation. Je ne m'excuserai pas d'utiliser les mathématiques pour raisonner à ce sujet, ce qui ne diminue en rien l'intérêt du résultat. 1 / deux 1pi1/21
whuber

1
vous ne devriez pas non plus vous excuser, il s'agit d'un résultat très intéressant (j'ai vraiment pensé wow quand je l'ai lu). Je préférerais simplement cela sous la forme "Résultat original", "Situation plus réaliste". La façon dont cela est écrit donne l’impression de tricherie (ce qui est injuste parce que, comme je le dis, c’est très intéressant), car je pourrais tout aussi bien dire: "Ce n’est évidemment pas 1: 1 car les naissances masculines sont plus fréquentes" (je crois en raison de nos locations historiques). mourir dans un conflit armé)
Richard Tingle

@ Richard C'est un bon point. Je me suis abstenu de discuter de versions plus réalistes de la question, telles que le changement de la moyenne du à environ (ce qui n’a aucun rapport avec le combat armé: il a une explication biologique), car le poste était trop long est et il devrait être clair comment généraliser ses méthodes à ce cas. Je préférerais rester concentré sur la résolution du paradoxe, qui consiste à trouver un mécanisme naturel (mais peut-être négligé) qui clarifie et explique le conflit apparent entre plusieurs réponses apparemment valables. 0,51pi0.51
whuber

@ Whuber Merci pour la réponse informative. Je ne comprends pas pourquoi, dans votre calcul, vous divisez la population en deux familles avec une probabilité différente de donner naissance à une fille. Selon le point 1 de votre hypothèse de modèle, le p_i devrait être le même pour toutes les familles. Alors, pourquoi avez-vous divisé la population en 2 types de familles?
Mobius Pizza

14

La naissance de chaque enfant est un événement indépendant avec P = 0,5 pour un garçon et P = 0,5 pour une fille. Les autres détails (tels que les décisions familiales) ne font que vous distraire de ce fait. La réponse est donc que le rapport est de 1: 1 .

Pour expliquer cela: imaginez qu'au lieu d'avoir des enfants, vous jetez une pièce équitable (P (têtes) = 0,5) jusqu'à ce que vous obteniez une "tête". Disons que la famille A lance la pièce et obtient la séquence [queues, queues, têtes]. Ensuite, la famille B lance la pièce et prend une queue. Maintenant, quelle est la probabilité que les prochaines soient des têtes? Encore 0,5 , parce que c'est ce que signifie indépendant . Si vous deviez faire cela avec 1 000 familles (ce qui signifie 1 000 têtes montées), le nombre total de queues attendu est de 1 000, car chaque basculement (événement) était complètement indépendant.

Certaines choses ne sont pas indépendantes, telles que la séquence au sein d'une famille: la probabilité de la séquence [têtes, têtes] est égale à 0, différente de [queue, queue] (0.25). Mais puisque la question ne se pose pas à ce sujet, ce n'est pas pertinent.


3
Comme indiqué, cela est incorrect. Si les sexes étaient indépendants sans condition , il y aurait à long terme autant de séquences fille-fille dans les naissances parmi les familles qu'il y a de séquences garçon-garçon. Il y a beaucoup de ces derniers et jamais aucun des premiers. Il existe une forme d'indépendance, mais elle est conditionnelle à l'ordre de naissance.
whuber

1
@whuber On ne nous demande pas combien de séquences fille-fille il y a. Seul le ratio filles / garçons. Je n'ai pas déclaré que la séquence des naissances d'une mère individuelle est une série d'événements indépendants, tels que des lancers. Seulement, chaque naissance, individuellement, est un événement indépendant.
Tim S.

Vous devrez être beaucoup plus clair à ce sujet. J'ai mentionné les séquences qui démontrent le manque d'indépendance. Il vous incombe donc de préciser dans quel sens rigoureux "indépendance" s'applique ici.
whuber

@whuber Les événements sont indépendants au même titre que les flips. J'ai expliqué cela dans ma réponse.
Tim S.

3
@whuber les séquences fille-fille apparaissent si vous mettez toutes les naissances en ligne; après un couple termine le prochain aller dans etc etc
Richard Tingle

6

Imaginez lancer une pièce juste jusqu'à ce que vous observiez une tête. Combien de queues jetez-vous?

P(0 tails)=12,P(1 tail)=(12)2,P(2 tails)=(12)3,...

Le nombre attendu de queues est facilement calculé * pour être égal à 1.

Le nombre de têtes est toujours 1.

* si ce n'est pas clair pour vous, voir 'aperçu de la preuve' ici


6

Les couples avec exactement une fille et aucun garçon sont les plus communs

La raison pour laquelle tout cela fonctionne est que la probabilité d'un scénario dans lequel il y a plus de filles est beaucoup plus grande que celle où il y a plus de garçons. Et les scénarios où il y a beaucoup plus de garçons ont de très faibles probabilités. La façon dont cela fonctionne est illustré ci-dessous

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

Vous pouvez à peu près voir où cela se passe à ce stade, le nombre total de filles et de garçons va correspondre à un.

Filles attendues d'un couple garçons attendus d'un couple=n=1(12n)=1
=n=1(n1n2)=1

Limiter les solutions de wolfram

Toute naissance, quelle que soit sa famille, a 50% de chances d'être un garçon ou une fille

Tout cela a un sens intrinsèque car (comme le pourraient les couples), vous ne pouvez pas contrôler la probabilité qu'une naissance spécifique soit un garçon ou une fille. Peu importe qu'un enfant naisse d'un couple sans enfants ou d'une famille de cent garçons; la chance est de 50:50 donc si chaque naissance individuelle a une chance de 50:50, alors vous devriez toujours avoir la moitié des garçons et la moitié des filles. Et peu importe comment vous mélangez les naissances entre les familles; tu ne vas pas affecter cela.

Cela fonctionne pour toute règle 1

En raison de la possibilité de 50:50 pour toute naissance, le rapport finira par 1: 1 pour toute règle ( 1 raisonnable ) que vous pouvez énoncer. Par exemple, la règle similaire ci-dessous fonctionne également même

Les couples cessent d'avoir des enfants lorsqu'ils ont une fille ou ont deux enfants

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

Dans ce cas, le total des enfants attendus est plus facilement calculé

Filles attendues d'un couple attendues d'un couple=0.51+0.251=0.75
=0.251+0.252=0.75

1 Comme je l'ai dit, cela fonctionne pour toute règle raisonnable pouvant exister dans le monde réel. Une règle déraisonnable serait une règle dans laquelle les enfants attendus par couple étaient infinis. Par exemple, "Les parents ne cessent d'avoir des enfants que lorsqu'ils ont deux fois plus de garçons que de filles", nous pouvons utiliser les mêmes techniques que ci-dessus pour montrer que cette règle donne aux enfants une infinité:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

On peut alors trouver le nombre de parents avec un nombre fini d'enfants

Nombre attendu de parents avec enfants finis=m=1(11/(3m)2)=π254=0.18277.

Limiter les solutions de wolfram

Nous pouvons donc établir que 82% des parents auraient un nombre infini d’enfants; du point de vue de l'urbanisme, cela poserait probablement des problèmes et montrerait que cette situation ne pourrait pas exister dans le monde réel.


3
Le fait que les naissances ne soient pas indépendantes est évident en examinant les séquences de naissances: la séquence fille-fille n'apparaît jamais alors que les séquences garçon-garçon se produisent souvent.
whuber

1
@whuber, je vois ce que vous voulez dire (bien que ce soit sans doute la décision d'avoir un enfant qui soit dépendant, plutôt que le résultat de l'événement lui-même), il serait peut-être préférable de dire "la probabilité d'une future naissance d'être un garçon est indépendante de toutes les naissances passées "
Richard Tingle

Oui, je pense qu'il y a un moyen de sauver l'usage de l'indépendance ici. Mais cela touche - je pense - au coeur du sujet, il semble donc que pour donner suite à la demande du PO de procéder à une démonstration "vigoureuse" (rigoureuse?), Il est nécessaire de raisonner avec soin à ce sujet.
whuber

@ whuber Pour être honnête, ce premier paragraphe est la partie à la main, les autres paragraphes (et plus particulièrement les limites) sont supposés être la partie la plus rigoureuse
Richard Tingle

Aucun argument là-bas - mais ce dernier matériau a déjà été couvert de la même manière dans les réponses à stats.stackexchange.com/a/93833 , stats.stackexchange.com/a/93835 et stats.stackexchange.com/a/93841 .
whuber

5

Vous pouvez également utiliser la simulation:

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio

1
Les résultats de la simulation sont bons en ce qu'ils peuvent nous rassurer de ne pas commettre d'erreur grave dans une dérivation mathématique, mais ils sont loin de la démonstration rigoureuse demandée. En particulier, lorsque des événements rares qui contribuent beaucoup à une attente peuvent se produire (par exemple une famille de 20 garçons avant l’apparition d’une fille - ce qui est très improbable dans une simulation de seulement 10 000 familles), les simulations peuvent être instables ou même tout à fait faux, peu importe combien de temps ils sont itérés.
whuber

Reconnaître la distribution géométrique du nombre de garçons dans la famille est la principale étape de ce problème. Essayez:mean(rgeom(10000, 0.5))
AdamO

5

Cartographier cela m'a permis de mieux comprendre comment le ratio de la population à la naissance (supposée être de 1: 1) et celui de la population d'enfants seraient tous deux de 1: 1. Alors que certaines familles auraient plusieurs garçons mais une seule fille, ce qui m’avait initialement amené à penser qu’il y aurait plus de garçons que de filles, le nombre de ces familles ne serait pas supérieur à 50% et diminuerait de moitié avec chaque enfant supplémentaire, le nombre de familles avec une seule fille serait de 50%. Le nombre de garçons et de filles s'équilibrerait donc. Voir les totaux de 175 en bas. Ratio d'enfants


2

Ce que tu as eu était le plus simple et une réponse correcte. Si la probabilité qu'un nouveau-né soit un garçon est p, et que les enfants du mauvais sexe ne rencontrent pas d'accidents malheureux, alors peu importe si les parents décident d'avoir plus d'enfants en fonction de leur sexe. Si le nombre d'enfants est N et que N est grand, vous pouvez vous attendre à environ p * N garçons. Il n'y a pas besoin d'un calcul plus compliqué.

Il y a certainement d'autres questions, telles que "quelle est la probabilité que le dernier-né d'une famille avec enfants soit un garçon" ou "quelle est la probabilité que l'aîné des enfants d'une famille avec enfants soit un garçon". (L’un d’eux a une réponse correcte simple, l’autre une réponse fausse simple et obtenir une réponse correcte est délicat).


2

Laisser

Ω={(G),(B,G),(B,B,G),}

être l'espace échantillon et laisser

X: ΩRω|ω|-1

soit la variable aléatoire qui mappe chaque résultat, , sur le nombre de garçons qu’il implique. La valeur attendue des garçons, , revient alors à ωE(X)

E(X)=n=1(n-1)0.5n=1 ,

Essentiellement, la valeur attendue des filles est de 1. Le ratio est donc de 1 également.


2

C'est une question piège. Le rapport reste le même (1: 1). La bonne réponse est que cela n’affecte pas le taux de natalité, mais bien le nombre d’enfants par famille avec un facteur limitant de 2 naissances en moyenne par famille.

C'est le genre de question que vous pourriez trouver lors d'un test logique. La réponse ne concerne pas le taux de natalité. C'est une distraction.

Ce n'est pas une question de probabilité, mais une question de raisonnement cognitif. Même si vous avez répondu au ratio 1: 1, vous avez quand même échoué au test.


J'ai récemment modifié ma réponse pour montrer que la solution n'est pas nécessairement 1: 1, ce qui contredit explicitement vos assertions.
whuber

J'ai lu ta réponse. Vous avez introduit un prédicat qui n'est pas indiqué dans le problème (variance du taux de natalité des femmes). Rien dans le problème n'affirme que la République Zorganienne est représentative de la population humaine ou même des humains.
Andrew - OpenGeoCode

1
C'est exact, mais rien ne justifie également l'hypothèse trop simpliste selon laquelle toutes les probabilités de naissance sont les mêmes. Des hypothèses doivent être émises afin de fournir une réponse objective et défendable. Ainsi, au moins une bonne réponse sera explicite sur les hypothèses qu’elle repose et fournira un appui à ces hypothèses. Affirmer que "ceci n’est pas une question de probabilité" ne résout pas les problèmes, mais les néglige totalement.
whuber

@whuber - Le taux de natalité dans ce problème est un invariant. La variante du problème est le nombre de naissances par famille. La question est une distraction, cela ne fait pas partie du problème. <br/> La pensée latérale est la capacité de penser de manière créative, ou «en dehors de la boîte», comme on l’appelle parfois en affaires, d’utiliser votre inspiration et votre imagination pour résoudre des problèmes en les regardant sous un angle inattendu. La pensée latérale consiste à abandonner l'évidence, à laisser de côté les modes de pensée traditionnels et à abandonner les idées préconçues. [fyi> Je suis un scientifique principal au laboratoire]
Andrew - OpenGeoCode

1
Vous avez peut-être alors négligé un point clé de ma réponse: ses hypothèses maintiennent également la probabilité moyenne pour la population d'un invariant de naissance féminin à 1: 1 (d'une manière spécifique que j'espère clairement décrite). Je maintiens qu'il existe une "pensée latérale" importante dans toute résolution d'un paradoxe dans lequel les hypothèses sont examinées de manière critique: il faut de l'imagination et de bonnes compétences analytiques pour voir que l'on fait des hypothèses en premier lieu. Rejeter une question comme une simple "astuce", comme vous le faites ici, semblerait antithétique à la promotion ou à la célébration d'une telle pensée.
whuber

2

Je montre le code que j'ai écrit pour une simulation Monte Carlo (familles 500x1000) en utilisant le logiciel `MATLAB '. S'il vous plaît examiner le code afin que je ne me suis pas trompé.

Le résultat est généré et tracé ci-dessous. Cela montre que la probabilité de naissance simulée est en très bon accord avec la probabilité de naissance naturelle sous-jacente, quelle que soit la règle d’arrêt pour une plage de probabilité de naissance naturelle.

entrez la description de l'image ici

En jouant avec le code, il est plus facile de comprendre un point que je n'avais pas encore bien compris - comme le soulignent les autres, la règle d'arrêt est une distraction. La règle d’arrêt ne concerne que le nombre de familles pour une population déterminée ou, d’un autre point de vue, le nombre de naissances d’enfants pour un nombre fixe de familles. Le sexe est uniquement déterminé par les dés et le ratio ou la probabilité (qui est indépendante du nombre d'enfants) dépendra uniquement du garçon naturel: le taux de naissance de la fille.

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])

2

Laissez la variable aléatoire indiquant le enfant dans le pays soit prend des valeurs 1 et 0 si l'enfant est un garçon ou une fille , respectivement. Supposons que la probabilité marginale que chaque naissance soit un garçon ou une fille est de .ithXi0.5

Le nombre attendu de garçons dans le pays = (où est le nombre d'enfants dans le pays.)E[iXi]=iE[Xi]=0.5nn

De même, le nombre attendu de filles = .E[i(1Xi)]=iE[1Xi]=0.5n

L'indépendance des naissances n'est pas pertinente pour le calcul des valeurs attendues.


Réponse de Apropos @ whuber, s'il existe une variation de la probabilité marginale selon les familles, le rapport devient biaisé en faveur des garçons, car il y a plus d'enfants dans les familles à probabilité plus élevée que les familles à probabilité plus faible, ce qui a pour effet d'augmenter la somme de valeur attendue pour les garçons.


2

J'ai également programmé de manière indépendante une simulation dans matlab, avant de voir ce que les autres ont fait. Strictement parlant, ce n'est pas un MC car je ne fais l'expérience qu'une fois. Mais une fois suffit pour obtenir des résultats. Voici ce que ma simulation rapporte. Je ne prends pas position sur la probabilité que les naissances soient p = 0,5 en primitif. Je laisse la probabilité de naissance varier sur une plage de Pr (garçons = 1) = 0,25: 0,05: 0,75.

Mes résultats montrent que lorsque la probabilité s'écarte de p = 0,5, le sex-ratio est différent de 1: dans l'attente, le sex-ratio est tout simplement le rapport entre la probabilité de naissance d'un garçon et la probabilité de naissance d'une fille. C'est-à-dire qu'il s'agit d'une variable aléatoire géométrique, identifiée précédemment par @ månst. C'est ce que je crois que l'affiche originale était intuitive.

Mes résultats imitent de près ce que l'affiche ci-dessus avec le code matlab a faite, en faisant correspondre les sex-ratios aux probabilités de naissance d'un garçon de 0,45, 0,50 et 0,55. Je présente le mien en adoptant une approche légèrement différente pour obtenir les résultats avec un code plus rapide. Pour effectuer la comparaison, j’ai omis la section de code vec = vec (randperm (s, N)) car s n’est pas défini dans leur code et je ne connais pas l’intention initiale de cette variable (cette section de code semble également superflue - comme à l’origine déclaré).

Je poste mon code

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

Le graphique suivant est attendu compte tenu de la loi forte du grand nombre. Je le reproduis, mais le graphique qui compte est le deuxième.

entrez la description de l'image ici

Ici, une probabilité de population autre que 0,5 pour la naissance de l’un ou l’autre sexe de l’enfant modifiera le sex-ratio dans la population globale. En supposant que les naissances soient indépendantes (mais pas le choix de continuer à se reproduire), à ​​chaque cycle de reproduction conditionnelle, la probabilité démographique gouverne la composition générale des résultats des naissances des garçons et des filles. Ainsi, comme d'autres l'ont mentionné, la règle d'arrêt du problème est sans conséquence sur le résultat obtenu pour la population, comme l'a répondu l'affiche qui l'a identifiée comme étant la distribution géométrique.

entrez la description de l'image ici

Pour être complet, ce que la règle d’arrêt affecte, c’est le nombre de tours de reproduction dans la population. Comme je n’exécute l’expérience qu’une seule fois, le graphique est un peu irrégulier. Mais l’intuition est là: pour une taille de population donnée, à mesure que la probabilité de naissance d’une fille augmente, nous constatons que les familles ont besoin de moins de cycles de reproduction pour obtenir la fille souhaitée avant que toute la population ne cesse de se reproduire (évidemment, le nombre de tours dépendra de la la taille de la population, car cela augmente mécaniquement la probabilité qu'une famille ait, par exemple, 49 garçons avant d'avoir leur première fille)

entrez la description de l'image ici

La comparaison entre mes sex-ratios calculés:

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

et ceux de l'affiche précédente avec le code matlab:

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

Ce sont des résultats équivalents.


1

Cela dépend du nombre de familles.

Soit le nombre d’enfants d’une famille, c’est une variable géométrique aléatoire avec , c’est-à-dire que ce qui impliqueXp=0.5

P(X=x)=0.5x,x=1,2,3...
E(X)=2

Supposons qu'il y a familles dans le pays, le taux de filles est de N

NXi

Puisque (loi du grand nombre), le rapport couvre 1/2 si .Xi/NE(X)=2N

S'il n'y a que des familles finies, soit le nombre total d'enfants du pays: , alors a une distribution binomiale négative avec pmf TT=XiT

P(T=t)=CN1t10.5t,t=N,N+1...

Cela implique que où est la fonction hypergéométrique.2F1

E[NXi]=E[NT]=t=NNtCN1t10.5t=2F1(N,1,N+1,1)
2F1

Par conséquent, le nombre de filles attendu est .2F1(N,1,N+1,1)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.