Si 900 personnes sur 1000 déclarent qu'une voiture est bleue, quelle est la probabilité qu'elle soit bleue?


114

Ceci est apparu initialement dans le cadre de certains travaux que nous effectuons sur un modèle de classification de texte naturel, mais je l’ai simplifié ... Peut-être trop.

Vous avez une voiture bleue (par une mesure scientifique objective - elle est bleue).

Vous le montrez à 1000 personnes.

900 disent que c'est bleu. 100 pas.

Vous donnez cette information à quelqu'un qui ne peut pas voir la voiture. Tout ce qu'ils savent, c'est que 900 personnes ont dit qu'il était bleu et 100 non. Vous n'en savez pas plus sur ces personnes (les 1000).

Sur cette base, vous demandez à la personne: "Quelle est la probabilité que la voiture soit bleue?"

Cela a provoqué une énorme divergence d'opinions parmi ceux que j'ai demandés! Quelle est la bonne réponse s'il y en a une?


162
Je me demande quelle serait la réponse si vous changiez de voiture pour vous habiller .
user1717828

13
Alors, quelle est la question aux gens? "La voiture est-elle bleue?" ou "De quelle couleur est la voiture?"
kon psych

13
Qu'est-ce que cela signifie pour la voiture d'être bleue? Si certaines personnes disent que la voiture n'est pas bleue, il est probable que certaines personnes l'appellent en bleu et d'autres en l'appelant sous un autre nom. Cela ne signifie pas qu'ils ne sont pas d'accord sur la couleur, cela signifie qu'ils ne sont pas d'accord sur le nom de la couleur.
Ben

7
Je pense que la question serait beaucoup améliorée si vous donniez les différentes opinions divergentes que vous avez rencontrées. Dans l'état actuel des choses, les réponses ne peuvent qu'explorer à fond le domaine dans son ensemble, de la théorie des probabilités à la théorie des couleurs, voire à la biologie (daltonisme), et je ne vois pas en quoi cela vous aiderait vraiment.
AnoE

32
Il manque quelque chose dans la description du problème. 100 personnes qui nient que la voiture soit bleue alors que c'est bleu, c'est beaucoup de gens, vous ne pouvez pas simplement les écarter comme des erreurs aléatoires.
Aksakal

Réponses:


117

TL; DR: À moins que vous ne supposiez que les gens jugent la couleur de la voiture de manière déraisonnable, ou que les voitures bleues sont trop rares, le nombre élevé de personnes dans votre exemple signifie que la probabilité que la voiture soit bleue est fondamentalement de 100%.

Matthew Drury a déjà donné la bonne réponse, mais j'aimerais juste ajouter quelques exemples numériques, car vous avez choisi vos chiffres de telle sorte que vous obteniez des réponses assez similaires pour une large gamme de réglages de paramètres différents. Par exemple, supposons, comme vous l'avez dit dans l'un de vos commentaires, que la probabilité que les personnes jugent correctement la couleur d'une voiture est de 0,9. C’est-à-dire: et aussi p ( disons qu'il n'est pas bleu | car n'est pas bleu ) = 0,9 = 1 - p ( disons qu'il est bleu | la voiture n'est pas bleue )

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

Ceci fait défini, il reste à décider quelle est la probabilité a priori que la voiture soit bleue? Choisissons une probabilité très faible pour voir ce qui se passe et disons que , c'est-à-dire que seulement 0,1% de toutes les voitures sont bleues. Ensuite, la probabilité postérieure que la voiture soit bleue peut être calculée comme suit:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

Si vous regardez le dénominateur, il est assez clair que le deuxième terme de cette somme sera négligeable, car la taille relative des termes de la somme est dominée par le ratio de à , ce qui est de l'ordre de . Et en effet, si vous effectuez ce calcul sur un ordinateur (en prenant soin d'éviter les problèmes de dépassement numérique), vous obtenez une réponse égale à 1 (avec une précision machine). 0,1 900 10 580.99000.19001058

La raison pour laquelle les probabilités antérieures importent peu, c'est parce que vous avez tellement de preuves pour une possibilité (la voiture est bleue) par rapport à une autre. Ceci peut être quantifié par le rapport de vraisemblance , que nous pouvons calculer comme :

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

Ainsi, avant même de considérer les probabilités antérieures, la preuve suggère qu’une option est déjà plus probable astronomiquement que l’autre, et pour que la précédente puisse faire la différence, les voitures bleues devraient être déraisonnablement, stupidement rares (si rares trouver 0 voitures bleues sur la terre).

Et si nous changions le degré de précision des personnes dans leurs descriptions de la couleur de la voiture? Bien sûr, nous pourrions pousser cela à l'extrême et dire qu'ils ne s'en sortent bien que 50% du temps, ce qui n'est pas mieux que de lancer une pièce de monnaie. Dans ce cas, la probabilité postérieure que la voiture soit bleue est simplement égale à la probabilité antérieure, car les réponses des gens ne nous ont rien dit. Mais il est certain que les gens font au moins un peu mieux que cela, et même si on dit que les gens ne sont exacts que 51% du temps, le rapport de vraisemblance reste tel qu’il est environ fois fois plus probable pour la voiture. être bleu.1013

Tout cela est dû aux nombres plutôt importants que vous avez choisis dans votre exemple. Si 9 personnes sur 10 déclaraient que la voiture était bleue, la situation aurait été bien différente, même si le même nombre de personnes se trouvait dans un camp par rapport à l'autre. Parce que les preuves statistiques ne dépendent pas de ce ratio, mais plutôt de la différence numérique entre les factions opposées. En fait, dans le rapport de probabilité (qui quantifie la preuve), les 100 personnes qui disent que la voiture n'est pas bleue annulent exactement 100 des 900 personnes qui disent qu'elle est bleue, c'est donc la même chose que si vous aviez 800 personnes qui étaient d'accord c'était bleu. Et c'est évidemment une preuve assez claire.

(Edit: Comme Silverfish l’a fait remarquer , les hypothèses que j’ai formulées ici impliquaient en réalité que, chaque fois qu’une personne décrit de manière incorrecte une voiture non bleue, elle dira par défaut que c’est une voiture bleue. Cela ne changera rien aux conclusions, car moins il y a de chances que les gens confondent une voiture non bleue avec une voiture bleue, plus il est évident qu’elle est bleue quand ils le disent. Donc, si quelque chose se passe, les chiffres donnés ci-dessus ne sont en réalité qu'une limite inférieure de la preuve pro-bleue.)


11
+1 En fait, étant donné les données d'OP, l'estimation MLE de la fréquence à laquelle les gens sont précis est 900/1000 = 90%.
amibe

5
Obtenir une couleur de voiture correcte dans 50% des cas n’est pas la même chose que de lancer une pièce de monnaie. Après tout, il existe bien plus que deux couleurs disponibles. Aussi, peut-être que certains disent "marine" ou "bleu" au lieu de "bleu"? En fait, beaucoup de gens diront à tort «bleu» si la bonne réponse serait «une couleur brevetée élégante et tendance qui ressemble presque au bleu»
Hagen von Eitzen

10
Je sais que ce ne sont que des chiffres illustratifs, mais si "la probabilité que les gens jugent correctement la couleur d’une voiture est de 0,9", alors, sauf s’il ya quelque chose de spécial dans la couleur bleue, je ne pense pas qu’il soit raisonnable de réclamer p (disons c'est bleu | la voiture n'est pas bleue) = 0.1. Si nous pensons que 90% du temps, les gens identifient la bonne couleur, alors p (disons rouge | voiture est rouge) = p (disons blanc | voiture est blanche) = p (disons vert | voiture est verte) = 0,9 et ainsi de suite pour toutes les couleurs de voiture possibles. Mais pourquoi p (par exemple bleu | voiture est rouge) = p (par exemple bleu | voiture est blanche) = p (par exemple bleu | voiture est verte) = 0,1? Cela impliquerait par exemple p (disons que blanc | car est rouge) = 0.
Silverfish

2
@PatMolloy: Pas nécessairement. Cela dépend si les probabilités sont symétriques: est-il également probable que quelqu'un prenne une erreur bleue pour une voiture non bleue, tout comme quelqu'un qui prend une erreur non bleue pour une voiture bleue? Si c'est le cas, un verdict de 500/500 donne exactement autant d'informations qu'un tirage au sort. Mais si les gens sont moins susceptibles de dire qu'une voiture non bleue est bleue, ils ne peuvent pas dire qu'une voiture bleue n'est pas bleue, les 500 voyants bleus sont plus difficiles à expliquer que les 500 non voyants bleus, hypothèse non bleue. Donc, dans ce cas, la prépondérance des preuves basculerait vers le bleu.
Ruben van Bergen

3
La perception des couleurs est une chose délicate. Si neuf personnes sur dix déclarent qu'une robe est blanche et dorée, quelle est la probabilité qu'elle soit bleue et noire?
Glen_b

73

La réponse correcte dépend d'informations non spécifiées dans le problème. Vous devrez donc formuler d'autres hypothèses pour obtenir une réponse unique et définitive:

  • La probabilité a priori que la voiture soit bleue, c'est-à-dire votre conviction que la voiture est bleue étant donné que vous ne l'avez encore demandé à personne.
  • La probabilité que quelqu'un vous dise que la voiture est bleue alors qu'elle est bleue, et la probabilité qu'elle vous dise que la voiture est bleue quand elle ne l' est pas .
  • La probabilité que la voiture soit réellement bleue quand quelqu'un le dit, et la probabilité que la voiture ne soit pas bleue, quand quelqu'un dit qu'elle est bleue.

Avec ces informations, nous pouvons tout décomposer avec la formule de Bayes pour obtenir une probabilité postérieure que la voiture soit bleue. Je vais me concentrer sur le cas où nous ne demandons qu'une seule personne, mais le même raisonnement peut être appliqué au cas où vous posez la question à personnes.1000

Ppost(car is blue)=P(car is bluesay is blue)P(dis est bleu)    +P(la voiture est bleue|dis n'est pas bleu)P(dis n'est pas bleu)

Nous devons continuer à décomposer davantage , c’est là que le prieur intervient:P(dis est bleu)

P(dis est bleu)= P(dis est bleu|la voiture est bleue)Pprjeor(la voiture est bleue)+P(dis est bleu|la voiture n'est pas bleue)Pprjeor(la voiture n'est pas bleue)

Donc, deux applications de la règle de Bayes vous mènent là. Vous devrez déterminer les paramètres non spécifiés en fonction des informations dont vous disposez sur la situation spécifique ou en faisant des hypothèses raisonnables.

Il existe certaines autres combinaisons d’hypothèses que vous pouvez formuler, en fonction:

P(dis est bleu|la voiture est bleue)P(la voiture est bleue)=P(la voiture est bleue|dis est bleu)P(dis est bleu)

Au début, vous ne connaissez aucune de ces choses. Vous devez donc faire des hypothèses raisonnables sur trois d'entre elles, puis la quatrième est déterminée à partir de là.


5
C'est souvent le cas. Ensuite, vous avez deux options: exprimez votre manque total de connaissances en supposant que le bleu et non le bleu sont également probables. Faites un rapide survol du terrain, quelque chose comme ceci peut vous aider: en.wikipedia.org/wiki/Car_colour_popularity
Matthew Drury

18
@ Matthew, le problème avec "bleu et non bleu est tout aussi probable" est que ce n'est pas cohérent; si nous appliquons le même raisonnement à chacune des couleurs de voiture possibles, nous finissons par prétendre qu'elles ont toutes simultanément 50% de chance (impossible avec plus de deux couleurs d'après les lois de la probabilité) et moins de 50% de chance regardez le bleu dans le "pas blanc" et "pas le rouge", ce qui conduit également à des contradictions puisque la probabilité d'une couleur ne peut prendre plusieurs valeurs)
Glen_b

2
Il y a plus d'informations non spécifiées que cela parce que la réponse des personnes n'a pas besoin d'être indépendante (en fait, nous espérons qu'elles sont fortement corrélées avec la couleur objective, donc loin d'être indépendantes). Et si les réponses sont "trop" dépendantes? Disons que nous demandons simplement à dix piétons au hasard, mais chacun d'entre eux répondra-t-il 100 fois?
Hagen von Eitzen

2
P(Joe et Mary disent bleu|la voiture est bleue)=P(Joe dit bleu|la voiture est bleue)P(Marie dit bleu|la voiture est bleue)

15
@Glen_b: Il n'y a que deux couleurs dans le monde, le bleu et pas le bleu. Certes, les deux viennent dans une variété de nuances, en particulier pas bleu.
psmears

13

Il existe une hypothèse importante selon laquelle vos 1000 opinions ne partagent pas un parti pris systématique. Ce qui est une hypothèse raisonnable ici, mais pourrait être important dans d'autres cas.

Des exemples pourraient être:

  • ils partagent tous un daltonisme similaire (génétique dans une population par exemple),
  • ils ont tous vu la voiture la nuit sous un éclairage orange au sodium,
  • ils partagent tous une culture commune dans laquelle le bleu est tabou ou magiquement associé (ce qui est indifférent au fait qu'ils décrivent ou non un objet comme étant bleu ou utilisent un euphémisme culturel ou autre),
  • on leur a tous dit (ou ils partagent une conviction commune) que s'ils répondaient / ne répondaient pas d'une manière spécifique, quelque chose de bien / mauvais leur arriverait .....

Ce n'est pas probable dans ce cas, mais c'est une hypothèse implicite significative dans d'autres cas. Cela ne doit pas forcément être extrême non plus: transposez votre question dans un autre domaine et ce sera un facteur réel.

Exemples pour chacun où votre réponse peut être affectée par un biais partagé:

  • Demandez si un grand verre fin contient plus qu'un verre court et identique en réalité, mais vos 1000 répondants sont de très jeunes enfants (perception erronée partagée).
  • demander à 1000 personnes si marcher sous une échelle est dangereux (croyance culturelle commune)
  • demandez à 1 000 personnes mariées si elles aiment leur partenaire / ont eu une liaison, dans des circonstances où elles croient que leur partenaire aura connaissance de leur réponse. Le contexte peut être une émission de télévision, ou un partenaire présent à la demande, etc. (opinion répandue sur les conséquences)

Il ne serait pas difficile d’imaginer des questions structurellement identiques dans lesquelles la réponse 900: 100 était une mesure des croyances et de l’honnêteté, ou quelque chose d’autre, sans indiquer la bonne réponse. Pas probable dans ce cas, mais dans d'autres cas - oui.


11

Une des raisons pour lesquelles vous obtenez des réponses différentes de personnes différentes est que la question peut être interprétée de différentes manières, et ce que vous entendez par «probabilité» n'est pas clair. Une façon de donner un sens à la question consiste à attribuer des a priori et une raison en utilisant la règle de Bayes comme dans la réponse de Matthew.

Avant de demander des probabilités, vous devez décider ce qui est modélisé comme aléatoire et ce qui ne l’est pas. Il n’est pas universellement accepté que des quantités inconnues mais fixes soient affectées à des priorités. Voici une expérience similaire à la vôtre qui met en évidence le problème posé par la question:

Xjeje=1,,1000p=0.5XjeΣje=11000Xje=900

pp


1
Donc, si vous supprimez l'hypothèse que la voiture est bleue et que le reste est la même, 900 personnes disent que c'est bleu et 100 ne le sont pas, dans ce cas, la probabilité serait de 0,9?
utilisateur

Non, c'est beaucoup plus proche de 1. Il est très très peu probable que 900 personnes sur 1000 se trompent de couleur.
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.cela ne correspond pas à une compréhension de la "probabilité" telle que je la connais. Cela ressemble un peu à "X peut arriver ou ne pas arriver, donc la probabilité doit être de 50%". Pouvez-vous préciser un peu plus ce que vous entendez par cette phrase?
AnoE

2
@AnoE la distinction est analogue à celle entre paramètres et variables aléatoires. Il est indiqué dans le cadre de la question que la voiture est en fait bleue, sa couleur n'est pas le résultat d'une expérience aléatoire. C'est essentiellement une interprétation fréquentiste v. Bayésienne. Si vous lancez une pièce 1000 fois et observez 900 têtes, quelle est la probabilité que la pièce soit juste? C'est un ou zéro si vous êtes un fréquentiste (ou absurde); nous n'affectons pas de probabilités à des paramètres.
ekvall

@utilisateur Non, j'ai mis à jour la réponse pour clarifier mon propos.
ekvall

7

Réponse simple et pratique:

La probabilité peut facilement aller de 0% à 100% selon vos hypothèses.

Bien que j'aime beaucoup les réponses existantes, cela revient essentiellement à ces deux scénarios simples:

Scénario 1: les gens sont supposés très bien reconnaître le bleu quand il est bleu ... 0%

Dans ce cas, il y a tellement de gens qui affirment que la voiture n'est pas bleue, qu'il est très peu probable que la voiture soit réellement bleue. Par conséquent, la probabilité approche 0%.

Scénario 2: les gens sont supposés très bien reconnaître non-bleu quand ce n'est pas bleu ... 100%

Dans ce cas, il y a tellement de gens qui déclarent que la voiture est bleue, qu'il est très probable qu'elle soit effectivement bleue. La probabilité est donc proche de 100%.


Bien sûr, en commençant par un angle mathématique, vous commenceriez par quelque chose de générique tel que "supposons que les probabilités pertinentes sont ...", ce qui est tout à fait dénué de sens, car de telles choses ne sont généralement pas connues pour des circonstances aléatoires. Par conséquent, je préconise de rechercher les extrêmes pour saisir l’idée que les deux pourcentages peuvent facilement être justifiés par des hypothèses simples et réalistes, et qu’il n’ya donc pas de réponse significative.


2
Si "les gens sont supposés très bien reconnaître le bleu", pourquoi estiment-ils qu'il est bleu alors que ce n'est pas dans le scénario 1? Vous voudrez peut-être exprimer vos scénarios en termes de fausses positivités et de faux négatifs.
Hyde

@hyde a reformulé les scénarios pour lever toute ambiguïté
Dennis Jaheruddin


5

Vous devez développer un cadre d’estimation. Certaines questions que vous pourriez poser sont

  1. Combien de couleurs y a-t-il? Parlons-nous de deux couleurs? Ou toutes les couleurs de l'arc-en-ciel?

  2. Quelle est la différence entre les couleurs? Parlons-nous bleu et orange? Ou bleu, cyan et turquoise?

  3. Qu'est-ce que cela signifie d'être bleu? Est-ce que le cyan et / ou le bleu turquoise? Ou juste bleu lui-même?

  4. Dans quelle mesure ces personnes évaluent-elles la couleur? Sont-ils tous des graphistes? Ou sont-ils daltoniens?

D'un point de vue purement statistique, on peut deviner le dernier. Premièrement, nous savons qu'au moins 10% des personnes choisissent une réponse incorrecte. S'il n'y a que deux couleurs (de la première question), alors on pourrait dire qu'il y a

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

En guise de vérification rapide, si nous additionnons ces éléments, nous obtenons 100%. Vous pouvez voir une notation plus mathématique de ceci à la réponse @MatthewDrury .

Comment pouvons-nous obtenir les 90% dans la troisième? C'est combien de personnes ont dit bleu mais se sont trompées si ce n'est pas le cas. Comme il n'y a que deux couleurs, celles-ci sont symétriques. S'il y avait plus de deux couleurs, alors le risque que le mauvais choix soit pris en bleu quand ils disaient autre chose serait moindre.

Quoi qu’il en soit, cette méthode d’estimation nous donne 90% de bleu. Cela inclut 81% de chances que les gens disent bleu quand c'est le cas et 9% de probabilité que les gens disent que ce n'est pas le cas. C’est probablement ce qui se fait de mieux que nous pouvons arriver à répondre à la question initiale et cela nous oblige à nous fier aux données pour estimer deux choses différentes. Et supposer que la probabilité que le bleu soit choisi est la même chose que la probabilité que le bleu soit correct.

S'il y a plus de deux couleurs, la logique va changer un peu. Les deux premières lignes restent les mêmes, mais nous perdons la symétrie des deux dernières lignes. Dans ce cas, nous avons besoin de plus d’informations. Nous pourrions peut-être estimer la probabilité que le bleu soit correctement redéfini à 81%, mais nous n'avons aucune idée des probabilités que la couleur devienne bleue lorsque quelqu'un dit que ce n'est pas le cas.

Nous pourrions également améliorer même l'estimation des deux couleurs. Avec un nombre statistiquement significatif de voitures de chaque couleur, nous pourrions avoir un nombre statistiquement significatif de personnes qui les regardent et les catégorisent. Ensuite, nous pourrions compter combien de fois les gens ont raison quand ils font chaque choix de couleur et combien de fois ils ont raison pour chaque choix de couleur. Nous pourrions ensuite estimer plus précisément les choix réels des personnes.

Vous pourriez vous demander comment 90% pourraient se tromper. Considérez ce qui se passe s'il y a trois couleurs: bleu azur, bleu et saphir. Quelqu'un pourrait raisonnablement considérer que ces trois éléments sont bleus. Mais nous voulons plus. Nous voulons l'ombre exacte. Mais qui se souvient des noms des autres teintes? Beaucoup pourraient deviner bleu parce que c'est la seule nuance correspondante qu'ils connaissent. Et encore se tromper quand il s'avère être azur.


Comme mentionné dans l'un des commentaires précédents, les deux seules couleurs pertinentes sont sûrement «bleu» et «pas bleu», de sorte que la partie concernant les couleurs multiples ne devrait pas être nécessaire.
Dennis Jaheruddin

4

Une probabilité exacte, mathématique, vraie / fausse ne peut pas être calculée avec les informations que vous fournissez.

Cependant, dans la vraie vie, de telles informations ne sont jamais disponibles avec certitude. Par conséquent, en utilisant notre intuition (et où tout mon argent irait si nous misions), la voiture est définitivement bleue. (Certains pensent que ce ne sont plus des statistiques, mais bon, les points de vue noir / blanc sur la science ne sont pas très utiles)

Le raisonnement est simple. Supposons que la voiture n'est pas bleue. Ensuite, 90% des personnes (!) Se sont trompées. Ils ne peuvent se tromper que par une liste de problèmes comprenant:

  • daltonisme
  • mensonge pathologique
  • être sous l'influence de substances comme l'alcool, les LCD, etc.
  • ne pas comprendre la question
  • autre forme de trouble mental
  • une combinaison de ce qui précède

Étant donné que ce qui précède n’est clairement pas susceptible d’affecter 90% d’une population aléatoire moyenne (par exemple, le daltonisme touche environ 8% des hommes et 0,6% des femmes, soit 43 personnes sur 1000), c’est nécessairement le cas de la voiture. bleu. (C’est là que tout mon argent irait de toute façon).


Cela me semble intuitivement intuitif. Je pense que la critique de la question initiale est que ne donne pas assez d’informations et que certaines hypothèses doivent être émises.
Pat Molloy

@PatMolloy Il ne donne pas assez d'informations pour fournir une réponse mathématique sophistiquée exacte / incorrecte (ce qui est certainement ce que de nombreuses questions visent à obtenir de ce site). Cependant, étant donné les informations réduites que vous avez données, c’est la réponse (100%) que les gens choisiront.
luchonacho

1
Je pense que vous avez omis de couvrir certaines des solutions les plus plausibles - celles qui devraient vous amener à modifier votre conclusion. Ceux-ci incluent (a) les personnes sont incapables de reconnaître le bleu; (b) il n'y a pas de compréhension commune du "bleu" entre le questionneur et les répondants; (c) le sens "scientifique" de "bleu" diffère de ce que les gens comprennent généralement par "bleu". De manière importante, étant donné que vous ne pouvez quantifier aucune de ces alternatives, ni la plupart de celles que vous avez énumérées, comment pouvez-vous justifier de quantifier la probabilité de la réponse? Ce ne sont pas des statistiques!
whuber

"Étant donné que ce qui précède n'est clairement pas susceptible d'affecter 90% d'une population aléatoire moyenne" N'en soyez pas si sûr. Rappelez-vous que nous parlons généralement en termes de moyennes lorsque nous parlons d’êtres humains. Bien sûr, seuls quelques pour cent souffrent de daltonisme (par rapport à la moyenne), mais quelques-uns d'entre eux ont une vision supérieure, par exemple les tétrachromates.
NPSF3000 Le

2
Je suis toujours sous l'influence du LCD
Alex

2

Je ne mangerais pas les matières fécales en raison du fait que des milliards de mouches ne peuvent pas avoir tort. Il pourrait y avoir des dizaines d'autres raisons pour lesquelles 900 personnes sur 1000 pourraient avoir été trompées en pensant que la voiture est bleue. Après tout, c’est la base des tours de magie, qui incitent les gens à penser que quelque chose est éloigné de la réalité. Si 900 personnes sur 1 000 voient un magicien poignarder son assistant, ils répondront rapidement que l'assistant a été poignardé, à quel point un homicide est improbable sur la scène. Une lumière bleue sur une peinture automobile réfléchissante, ça vous tente?


2

La personne interrogée en sait trop peu sur la manière dont le sondage a été effectué pour pouvoir répondre à la question avec précision. En ce qui le concerne, le sondage peut avoir plusieurs problèmes:

Les personnes qui ont participé au sondage auraient pu être biaisées:

  1. La voiture avait l'air bleue à cause d'une illusion d'optique .

  2. La couleur de la voiture était difficile à observer pour une raison quelconque, et beaucoup de voitures bleues avaient déjà été montrées à la population avant celle-ci.

  3. Vous les aviez payés pour dire que la voiture était bleue.

  4. Vous avez eu quelqu'un qui les hypnotisait tous en leur faisant croire que la voiture était bleue.

  5. Ils avaient conclu un pacte pour mentir et saboter le scrutin.

Il peut y avoir eu des corrélations entre les personnes participant au sondage en raison de la manière dont elles ont été sélectionnées ou de l'influence qu'elles se sont mutuellement affectées:

  1. Vous avez accidentellement effectué le sondage lors d’une réunion de masse pour des personnes atteintes du même type de daltonisme.

  2. Vous avez effectué le sondage dans les jardins d'enfants; la voiture n’intéressait pas les filles et la plupart des garçons avaient le bleu comme couleur préférée, ce qui leur donnait l’imagination.

  3. La première personne à qui on a montré la voiture était en état d'ébriété et a pensé qu'elle avait l'air bleue, elle a crié "C'EST BLEU", ce qui a poussé tous les autres à penser que la voiture était bleue.

Ainsi, alors que la probabilité que la voiture soit bleue si le scrutin a été correctement effectué est extrêmement élevée (comme expliqué dans la réponse de Ruben van Bergen), la fiabilité du sondage peut avoir été compromise, ce qui fait en sorte que la voiture n'est pas bleue. insignifiant. La taille de la personne interrogée estime que cette chance sera finalement dépendante de son estimation de la probabilité que les circonstances fassent échouer le sondage et de la qualité de votre conduite du scrutin (et de la malhonnêteté dont il pense avoir été victime).


2

Quelle est la définition de "bleu"?

Différentes cultures et langues ont différentes notions de bleu. IIRC, certaines cultures incluent le vert dans leur notion de bleu!

Comme tout mot de langage naturel, vous ne pouvez que supposer qu'il existe une convention culturelle sur le moment (et le cas contraire) d'appeler les choses "bleues".

Dans l’ensemble, la couleur dans le langage est étonnamment subjective (lien tiré des commentaires ci-dessous, merci @Count Ibilis)

entrez la description de l'image ici


7
Dans le contexte de la question, je pense que cet aspect particulier est assez peu pertinent - je suppose que le PO a choisi le mot "bleu" comme un terme très générique et non quelque chose comme "azur", "torqouise" etc. où les gens pourraient ne pas être sûrs. En outre, les voitures ont tendance à utiliser une palette très limitée de couleurs possibles / habituelles. Enfin, la question n'est pas "pourquoi 100 personnes ont-elles dit non bleu", mais "quelle probabilité que la voiture soit réellement bleue".
AnoE


Une définition précise serait "émet une lumière ayant principalement une longueur d’onde de 475 nm + 10 ~ 20 nm dans les conditions environnementales actuelles". Ceci est généralement accepté comme bleu.
rackandboneman

Oui, mais combien de personnes disposent d'un outil pour mesurer la longueur d'onde prédominante? Vous avez également oublié d’exclure les longueurs d’ondes non visibles.
Anony-Mousse

1
La question semble porter sur l’utilisation statistique d’un groupe de personnes dont le calibre est inconnu comme compteur de longueur d’onde :)
rackandboneman

1

La probabilité pourrait, selon des conditions préalables plus précises, être plusieurs valeurs différentes, mais 99,995% est celle qui a le plus de sens pour moi.

Nous savons, par définition, que la voiture est bleue (c'est à 100%), mais ce que cela signifie réellement n'est pas bien précisé (cela parierait un peu philosophique). Je supposerai que quelque chose est bleu dans le sens où l'on peut vraiment être vu comme tel.

Nous savons également que 90% des sujets testés l'ont signalé en bleu.

Nous ne savons pas ce qui a été demandé, ni comment l'évaluation a été effectuée, ni dans quelles conditions d'éclairage se trouvait la voiture. Lorsqu'on a demandé à nommer la couleur, certains sujets auraient par exemple pu dire "bleu verdâtre" en raison des conditions d'éclairage, et l'évaluateur pourrait ne pas avoir compté cela comme "bleu". Les mêmes personnes auraient peut-être répondu "oui" si la question était "Est-ce que c'est bleu?". Je supposerai que vous n'aviez pas l'intention de tromper malicieusement vos sujets de test.

Nous savons que l’incidence de la tritanopie est d’environ 0,005%, ce qui signifie que si la voiture pouvait être considérée comme bleue , alors 99,995% des sujets du test ont effectivement vu la couleur bleue. Cela signifie toutefois que 9,995% des sujets de test n'ont pas signalé de bleu lorsqu'ils ont clairement vu le bleu. Ils mentaient à propos de ce qu'ils ont vu. Ceci est proche de ce que votre expérience de vie vous dit aussi: les gens ne sont pas toujours honnêtes (mais, à moins d’un motif, ils le sont généralement).

Ainsi, le non-observateur peut supposer avec une certitude accablante que la voiture est bleue. Ce serait 100%

Sauf que ... sauf si la personne qui n'observe pas elle-même souffre de tritanopie, dans ce cas, elle ne verrait pas la voiture comme bleue, même si tout le monde (ou plutôt 90% d'entre eux) le dit. Ici, cela redevient philosophique: si tout le monde a entendu un arbre tomber, mais pas moi, est-ce qu'il est tombé?

Je pense que la réponse la plus raisonnable et la plus pratique serait: Si la personne qui n'observe pas se trouve être un trianope (0,005% de chance), alors vérifier si la couleur prédite et la couleur réelle sont identiques est faux. Ainsi, la probabilité est de 99,995% plutôt que 100%.

De plus, en bonus, puisque nous avons découvert que 9,995% des sujets de test sont des menteurs et qu'il est connu que tous les Crétois sont des menteurs , nous pouvons en conclure que nous ne sommes pas en Crète!


1

Vous avez une voiture bleue (par une mesure scientifique objective - elle est bleue).

...

"Quelle est la probabilité que la voiture soit bleue?"

C'est 100% bleu.

Tout ce qu'ils savent, c'est que 900 personnes ont dit qu'il était bleu et 100 non. Vous n'en savez pas plus sur ces personnes (les 1000).

Utiliser ces chiffres (sans aucun contexte) est totalement insensé. Tout se résume à une interprétation personnelle de la question. Nous ne devrions pas emprunter ce chemin et utiliser celui de Wittgenstein: "Wovon man nicht sprechen kann, darüber muss man schweigen."


Imaginez la question suivante pour la comparaison:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

C’est fondamentalement le même problème (information moins), mais il est beaucoup plus clair que ce que nous pensons de la couleur de la voiture est essentiellement (sinon complètement) circonstanciel.


À long terme, lorsque nous avons plusieurs questions associées, nous pouvons alors commencer à deviner les réponses à ces questions incomplètes. Il en va de même pour l’algorithme tit-pour-tat qui ne fonctionne pas dans un seul cas, mais fonctionne à long terme . Dans le même sens, Wittgenstein est revenu de ses travaux antérieurs avec ses enquêtes principales . Nous sommes en mesure de répondre à ces questions, mais nous avons besoin de plus d’informations / essais / questions. C'est un processus.


0

Si nous supposons que la voiture est bleue, alors 100 sur 1 000 affirmant qu'elle n'est pas bleue impliquent un biais d'échantillon extrême. Peut-être n’avez-vous échantillonné que des daltoniens? Si nous supposons que la voiture n'est pas bleue, le biais de l'échantillon est encore pire. Nous ne pouvons donc que conclure des données fournies que l’échantillon est très biaisé, et comme nous ne savons pas comment il était biaisé, nous ne pouvons rien conclure à propos de la couleur de la voiture.


Umm, sûrement que 900 personnes aient dit que c'était bleu est bon pour quelque chose? Ne pouvons-nous pas en conclure qu'il est plus probable d'être bleu que pas ?? N'oubliez pas que le répondant ne connaît que les chiffres 900 et 100. Peut-il donc vraiment dire quelque chose à propos de partialité?
Pat Molloy

0

Il y a eu des réponses. Je ne suis en aucun cas un gourou des mathématiques, mais bon, voici le mien.

Il ne peut y avoir que 4 possibilités:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

D'après la question, vous savez que la somme des cas 1 et 4 est de 900 personnes (90%) et que la somme des cas 2 et 3 est de 100 personnes (10%). Cependant, voici le piège: ce que vous ne savez pas, c'est la distribution entre ces 2 paires de cas. Peut-être que la somme des cas 1 et 4 est entièrement composée du cas 1 (ce qui signifie que la voiture est bleue), ou peut-être que la somme totale est composée du cas 4 (qui signifie que la voiture n'est pas bleue). Il en va de même pour la somme des cas 2 + 3. Alors… Ce dont vous avez besoin, c'est de trouver un moyen de prédire la distribution dans les sommes au cas par cas. Sans autre indication dans la question (nulle part, il est dit que les gens sont certains à 80% de connaître leurs couleurs ou quoi que ce soit de ce genre), il est impossible de trouver une réponse précise et définitive.

Cela dit, je soupçonne que la réponse attendue va dans le sens de:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

où les 50% restants sont simplement inconnus, appelez cela la marge d'erreur.


0

X,Y1,Y2,,Y1000{0,1}1p(X)pXYje|X=1p1Yje|X=0p0θ=(pX,p0,p1)

p(θ,X|y1:1000)αp(θ)p(X|θ)Πje=11000p(yje|X)

{Xje}{yje|X}


-3

La personne qui ne peut pas voir la voiture ne sait pas qu'il est scientifiquement prouvé qu'elle est bleue. La probabilité que la voiture soit bleue est de 50/50 (elle est bleue ou elle ne l’est pas). Interroger d'autres personnes peut influencer l'opinion de cette personne, mais cela ne change en rien la probabilité qu'une voiture invisible soit bleue ou non.

Tous les calculs ci-dessus déterminent la probabilité que votre ensemble d'échantillons puisse déterminer s'il est bleu.


Je ne suis pas sûr que ce soit vrai que la probabilité qu'il soit bleu est de 50/50. En fait, elle est bien inférieure à 50, car elle pourrait être rouge, blanche, jaune, etc. La probabilité qu'une voiture choisie au hasard soit bleue est bien inférieure à 50%.
utilisateur
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.