Déterminer la taille de l'échantillon avec une proportion et une distribution binomiale


10

J'essaie d'apprendre quelques statistiques en utilisant le livre, Biometry by Sokal and Rohlf (3e). Il s'agit d'un exercice du 5ème chapitre qui couvre la probabilité, la distribution binomiale et la distribution de Poisson. entrez la description de l'image ici

Je me rends compte qu'il existe une formule pour produire une réponse à cette question: Cependant, cette équation n'est pas dans ce texte. Je voudrais savoir comment calculer la taille de l'échantillon en ne connaissant que la probabilité, le niveau de confiance souhaité et la distribution binomiale. Existe-t-il des ressources couvrant ce sujet sur lesquelles je peux être pointé? J'ai essayé Google, mais ce que j'ai vu jusqu'à présent nécessite des informations auxquelles je n'ai pas accès dans ce problème.

n=4(pq)2

1
Voulez-vous être guidé dans un voyage pour trouver la réponse ou préférez-vous simplement recevoir la réponse, avec une explication de pourquoi c'est la réponse?
jbowman

2
Un voyage sonne bien. Ce n'est pas pour une classe et la réponse est donnée à la fin de la question. Peu m'importe la réponse - je la connais déjà! J'ai suivi un cours de statistiques il y a de nombreuses années, mais je ne l'ai pas suffisamment apprécié à l'époque. J'essaie d'y remédier maintenant et je commence vraiment à comprendre les schémas sous-jacents. J'apprécierais l'aide. Ce problème particulier ne semble pas correspondre aux autres de cette section et une approche appropriée n'est pas clairement démontrée (pour moi) à partir des informations du texte sur la distribution binomiale ni de ses exemples donnés.
dérouté

1
Je serais très intéressé à lire une réponse détaillée (avec des pointeurs pour une lecture plus approfondie si nécessaire) à cette question.
Zhubarb du

2
Prenons un exemple concret et simple; vous avez 5 diapositives d'une personne qui a le pathogène. Quelle est la probabilité que vous n'identifiiez pas correctement cette personne comme ayant le pathogène? Une hypothèse cachée est que la présence / absence du pathogène sur une lame est indépendante de la présence / absence du pathogène sur d'autres lames prélevées sur le même échantillon.
jbowman

1
Ce serait la probabilité d'obtenir 5 faux négatifs d'affilée:
dérouté

Réponses:


8

Ce serait la probabilité d'obtenir un faux négatif sur 5 diapositives:

(0,80) ^ 5 = 0,32768

Ahhh, donc pour diminuer la probabilité de faux négatifs en dessous de 1%, vous pouvez faire:

> x <- matrix(c(0), nrow=25)
> for(i in 1:25) x[i] = (0.8)^i
> x
             [,1]
 [1,] 0.800000000
 [2,] 0.640000000
 [3,] 0.512000000
 [4,] 0.409600000
 [5,] 0.327680000
 [6,] 0.262144000
 [7,] 0.209715200
 [8,] 0.167772160
 [9,] 0.134217728
 [10,] 0.107374182
 [11,] 0.085899346
 [12,] 0.068719477
 [13,] 0.054975581
 [14,] 0.043980465
 [15,] 0.035184372
 [16,] 0.028147498
 [17,] 0.022517998
 [18,] 0.018014399
 [19,] 0.014411519
 [20,] 0.011529215
 [21,] 0.009223372
 [22,] 0.007378698
 [23,] 0.005902958
 [24,] 0.004722366
 [25,] 0.003777893

Et constater que le taux de faux positifs est inférieur à 1% à i = 21.

Génial! Merci. Je ne peux pas croire que je n'ai pas vu ça. J'essayais toutes sortes de probabilités conditionnelles et autres pour une raison quelconque. Restez simple, stupide ...


1
Oui, parfois les problèmes les plus simples sont les plus difficiles!
jbowman
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.