TL; DR: À moins que vous ne supposiez que les gens jugent la couleur de la voiture de manière déraisonnable, ou que les voitures bleues sont trop rares, le nombre élevé de personnes dans votre exemple signifie que la probabilité que la voiture soit bleue est fondamentalement de 100%.
Matthew Drury a déjà donné la bonne réponse, mais j'aimerais juste ajouter quelques exemples numériques, car vous avez choisi vos chiffres de telle sorte que vous obteniez des réponses assez similaires pour une large gamme de réglages de paramètres différents. Par exemple, supposons, comme vous l'avez dit dans l'un de vos commentaires, que la probabilité que les personnes jugent correctement la couleur d'une voiture est de 0,9. C’est-à-dire:
et aussi
p ( disons qu'il n'est pas bleu | car n'est pas bleu ) = 0,9 = 1 - p ( disons qu'il est bleu | la voiture n'est pas bleue )
p(say it's blue|car is blue)=0.9=1−p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1−p(say it is blue|car isn't blue)
Ceci fait défini, il reste à décider quelle est la probabilité a priori que la voiture soit bleue? Choisissons une probabilité très faible pour voir ce qui se passe et disons que , c'est-à-dire que seulement 0,1% de toutes les voitures sont bleues. Ensuite, la probabilité postérieure que la voiture soit bleue peut être calculée comme suit:p(car is blue)=0.001
p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999
Si vous regardez le dénominateur, il est assez clair que le deuxième terme de cette somme sera négligeable, car la taille relative des termes de la somme est dominée par le ratio de à , ce qui est de l'ordre de . Et en effet, si vous effectuez ce calcul sur un ordinateur (en prenant soin d'éviter les problèmes de dépassement numérique), vous obtenez une réponse égale à 1 (avec une précision machine). 0,1 900 10 580.99000.19001058
La raison pour laquelle les probabilités antérieures importent peu, c'est parce que vous avez tellement de preuves pour une possibilité (la voiture est bleue) par rapport à une autre. Ceci peut être quantifié par le rapport de vraisemblance , que nous pouvons calculer comme :
p ( réponses | car is blue )p(answers|car isn't blue)=0.9900×0.11000.1900×0.9100≈10763
Ainsi, avant même de considérer les probabilités antérieures, la preuve suggère qu’une option est déjà plus probable astronomiquement que l’autre, et pour que la précédente puisse faire la différence, les voitures bleues devraient être déraisonnablement, stupidement rares (si rares trouver 0 voitures bleues sur la terre).
Et si nous changions le degré de précision des personnes dans leurs descriptions de la couleur de la voiture? Bien sûr, nous pourrions pousser cela à l'extrême et dire qu'ils ne s'en sortent bien que 50% du temps, ce qui n'est pas mieux que de lancer une pièce de monnaie. Dans ce cas, la probabilité postérieure que la voiture soit bleue est simplement égale à la probabilité antérieure, car les réponses des gens ne nous ont rien dit. Mais il est certain que les gens font au moins un peu mieux que cela, et même si on dit que les gens ne sont exacts que 51% du temps, le rapport de vraisemblance reste tel qu’il est environ fois fois plus probable pour la voiture. être bleu.1013
Tout cela est dû aux nombres plutôt importants que vous avez choisis dans votre exemple. Si 9 personnes sur 10 déclaraient que la voiture était bleue, la situation aurait été bien différente, même si le même nombre de personnes se trouvait dans un camp par rapport à l'autre. Parce que les preuves statistiques ne dépendent pas de ce ratio, mais plutôt de la différence numérique entre les factions opposées. En fait, dans le rapport de probabilité (qui quantifie la preuve), les 100 personnes qui disent que la voiture n'est pas bleue annulent exactement 100 des 900 personnes qui disent qu'elle est bleue, c'est donc la même chose que si vous aviez 800 personnes qui étaient d'accord c'était bleu. Et c'est évidemment une preuve assez claire.
(Edit: Comme Silverfish l’a fait remarquer , les hypothèses que j’ai formulées ici impliquaient en réalité que, chaque fois qu’une personne décrit de manière incorrecte une voiture non bleue, elle dira par défaut que c’est une voiture bleue. Cela ne changera rien aux conclusions, car moins il y a de chances que les gens confondent une voiture non bleue avec une voiture bleue, plus il est évident qu’elle est bleue quand ils le disent. Donc, si quelque chose se passe, les chiffres donnés ci-dessus ne sont en réalité qu'une limite inférieure de la preuve pro-bleue.)