Comment savoir la probabilité d'échec s'il n'y a pas eu d'échec?


50

Je me demandais s’il existait un moyen de déterminer la probabilité d’un échec (un produit) si nous avions 100 000 produits sur le terrain pendant un an et sans échec? Quelle est la probabilité que l’un des 10 000 prochains produits vendus échoue?


4
Quelque chose me dit que ce n'est pas le vrai problème de fiabilité. Il n'y a pas de produits avec un taux d'échec aussi bas.
Aksakal

Avant de pouvoir déduire quoi que ce soit des statistiques aux probabilités de taux de réussite / d’échec réels, vous avez besoin d’un modèle de répartition des taux de réussite / d’échec possibles. Votre description donne très peu de base pour déduire / supposer une telle distribution.
RBarryYoung

1
@RBarryYoung, veuillez vérifier les réponses fournies - elles fournissent peu d’approches intéressantes et valables du problème. Si vous n'êtes pas d'accord avec ces approches, n'hésitez pas à les commenter ou à apporter votre propre réponse.
Tim

2
@Aksakal - Un si faible taux d'échec ne semble pas impossible s'il s'agit d'un simple produit de grande valeur et présentant un risque si élevé en cas d'échec (comme un instrument chirurgical) qu'il passe par des niveaux de test et d'inspection (et éventuellement indépendant). certification) avant la libération. Bien entendu, l'inverse pourrait être vrai, le produit pourrait avoir une valeur si faible que les utilisateurs finaux ne signalent tout simplement pas de problèmes avec des produits défectueux (les fabricants de gumball ont sûrement un taux de défauts signalé inférieur à 1/100 000?), Le consommateur se débarrasse simplement et essaye un nouveau.
Johnny

@Johnny, quand Motorola proposait ils se vantaient qu'il y avait 3 échecs pour 100 millions de produits, ou quelque chose comme ça. 6σ
Aksakal

Réponses:


43

La probabilité qu'un produit échoue est sûrement fonction du temps et de l'utilisation. Nous ne disposons d'aucune donnée d'utilisation, et avec un an seulement, aucun échec (félicitations!). Ainsi, cet aspect (appelé fonction de survie ) ne peut pas être estimé à partir de vos données.

Cependant, vous pouvez penser aux échecs dans l’année suivant une distribution binomiale . Vous n'avez toujours pas d'échec, mais c'est maintenant un problème courant. Une solution simple consiste à utiliser la règle de 3 , qui est exacte avec un grand (que vous avez certainement). Plus précisément, vous pouvez obtenir la limite supérieure d'une unilatérale 95% intervalle de confiance (c. -à- la limite inférieure est ) sur la vraie probabilité de défaillance dans l'année . Dans votre cas, vous êtes à 95% confiant que le taux est inférieur à . 0 3 / N 0.00003N03/N0.00003

Vous avez également demandé comment calculer la probabilité qu’un ou plusieurs des 10 000 prochains échouent. Un rapide et simple (quoique extrême) façon d'étendre l'analyse ci - dessus est d'utiliser simplement la borne supérieure comme la probabilité sous - jacente et utiliser le CDF binomiale correspondant pour obtenir la probabilité qu'il n'y aura pas échecs. En utilisant du code, nous pourrions faire :, ce qui donne une chance de voir un ou plusieurs échecs dans les 10 prochains produits. En ayant utilisé la limite supérieure, il ne s’agit pas d’une estimation ponctuelle optimale de la probabilité d’avoir au moins une défaillance, mais vous pouvez plutôt affirmer qu’il est très peu probable que la probabilité de défaillance de soit supérieure à1 26 % ( F + 1 ) / ( N + 2 ) F p = 9,9998 × 10 - 06 1 +10 %0R1-pbinom(0, size=10000, prob=0.00003)0.2591851126%(reconnaissant qu'il s'agit d'un cadrage quelque peu "ondulé à la main"). Une autre possibilité consiste à utiliser la suggestion de @ amoeba concernant l'estimation tirée de la règle de succession de Laplace . La règle de succession stipule que la probabilité de défaillance estimée est , étant le nombre de défaillances. Dans ce cas, et le calcul de la probabilité prédite de échecs sur les 10 000 suivants sont , cédant ou . (F+1)/(N+2)Fp^=9.9998×10061+1-pbinom(0, size=10000, prob=9.9998e-06)0.0951612210%


3
+1 Je n'ai jamais entendu parler de la "règle de 3" auparavant. Je me demande s’il existe un lien entre la règle de 3 et "la règle de succession de Laplace"? Selon ce dernier (si je l'applique correctement), la probabilité de défaillance peut être estimée à . 1/(N+2)
amibe dit de réintégrer Monica le

14
@amoeba Cette règle de 3 est une limite de confiance unilatérale de 95%. Supposons que le nombre d'échecs a une distribution binomiale . Alors la chance de ne voir aucun échec est de . Pour que cela soit supérieur à , résolvez pour . En utilisant pour les petits , la solution est . Puisque , on obtient . C'est la "règle de 3." Cela vaut la peine de le savoir car vous savez maintenant comment faire varier le "3" si vous souhaitez ajuster le niveau de confiance et vous pouvez également l'inverser pour trouver le minimum nécessaire à la détection d'un taux de( 1 - p ) n 5 %(n,p)(1p)n5%p log ( 1 - p ) - p p p - log ( 0,05 ) / n 0,05 = 1 / vingt e 3 p 3 / n n p(1p)n0.05plog(1p)ppplog(0.05)/n0.05=1/20e3p3/nnp ou plus.
whuber

1
@ amoeba, comme je l’ai dit, j’ai pris un uniforme avant la probabilité d’échec. Je pense qu’un précédent différent aurait conduit à des résultats considérablement différents.
Yair Daon

1
Votre modification est en bonne progression (+1). Cependant, cela soulève des problèmes d'interprétation. Nous ne sommes pas "sûrs" que la chance n’excède pas car nous ne sommes pas tout à fait sûrs de la vraie chance sous-jacente. Nous n'avons pas de "limite supérieure" sur , mais seulement une limite de confiance supérieure. Lorsque vous donnez une prévision pour un événement futur, vous devez (a) l’estimer et (b) lui fournir des limites. Regardez-le comme ceci: donnez-nous des limites sur lorsque , indépendamment, subordonné à . Ces limites sont un intervalle de prédiction pour en fonction de .p Y X Binomial ( n , p ) Y Binomial ( m , p ) X = 0 Y X26%pYXBinomial(n,p)YBinomial(m,p)X=0YX
whuber

2
Oui pour la "règle de trois". Je l'ai vu du poing il y a de nombreuses années dans une courte note au "Journal de l'Association médicale américaine" jama.jamanetwork.com/article.aspx?articleid=385438
DWin

25

Vous pouvez adopter une approche bayésienne. notons la probabilité d'échec par et la considérons comme une variable aléatoire. A priori, avant de voir les résultats des expériences, vous pourriez croire que . Si vous faites confiance aux ingénieurs pour rendre ce produit fiable, vous pouvez peut-être utiliser ou plus. C'est toi qui vois. Ensuite, vous pouvez utiliser le théorème de Bayes pour calculer la distribution postérieure de . Notons l'événement que vous avez observé ( expériences avec zéro échec).Θ ~ U ( 0 , 1 ) Θ ~ U ( 0 , 0,1 ) θ A nΘΘU(0,1)ΘU(0,0.1)θAn

Θp(θ)np(A|θ)nθ

p(Θ=θ|A)=p(A|Θ=θ)p(Θ=θ)p(A)=p(A|θ)p(θ)p(A|θ)p(θ)dθ.
Tout est simple: est uniforme, donc est constant. Puisque vous exécutez expériences, représente simplement la probabilité d’absence d’ échec dans essais de bernouli avec une probabilité d’échec .Θp(θ)np(A|θ)nθ

Une fois que vous avez vous êtes gold: vous pouvez calculer la probabilité de tout événement en intégrant:B P ( B ) = p ( B | θ ) p ( θ | A ) d θp(θ|A)BP(B)=p(B|θ)p(θ|A)dθ

Ci-dessous, je travaille sur une solution détaillée, en suivant l'approche ci-dessus. Je vais prendre quelques raccourcis standard.

Soit le prieur soit . Alors: La constante de normalisation se trouve être - voir pages wikipedia fonction bêta et la distribution bêta . Donc, , qui est une distribution bêta avec les paramètres .p ( θ | A ) α p ( A | θ ) 1 = ( 1 - θ ) n . p ( A ) = p ( A | θ ) p ( θ ) d θ B ( 1 , n + 1 ) p ( θ | A )U(0,1)

p(θ|A)p(A|θ)1=(1θ)n.
p(A)=p(A|θ)p(θ)dθB(1,n+1) 1,n+1p(θ|A)=(1θ)nB(1,n+1)1,n+1

Indiquer la probabilité que ne rencontre aucune défaillance dans produits au cours de la prochaine année . La probabilité d'au moins un échec est de . Alors, B 1 - P ( B ) 1 - P ( B ) = 1 - ( 1 - θ ) m ( 1 - θ ) nmB1P(B)

1P(B)=1(1θ)m(1θ)nB(1,n+1)dθ=B(1,n+m+1)B(1,n+1)

soit approximativement , en utilisant . Pas très impressionnant? J'ai pris une distribution uniforme sur la probabilité d'échec. Peut-être avez-vous une meilleure confiance en vos ingénieurs.n = 100 , 000 , m = 10 , 0000.1n=100,000,m=10,000


3
Il semble étrange de ne pas trouver la solution réelle à un problème aussi simple, surtout lorsque la méthode semble si prometteuse. Suggérez-vous que les calculs sont difficiles?
whuber

2
@whuber je ne l'ai pas oublié, je pensais que cette dernière étape était évidente. Ce que je voulais dire par "sans pression", c’est que la probabilité d’échec de 10% est toujours grande, comparée à aucun échec lors des 100 000 premières exécutions. Aussi, merci pour le commentaire concernant les paires conjuguées, je pensais que cela risquerait de confondre le PO et de le distraire de ce qui est important, c'est pourquoi je l'ai omis.
Yair Daon

3
C'est évident, oui - mais lorsque vous vous retrouvez avec une valeur de 0,9, c'est le nombre que les gens verront, presque tout ce que vous en dites dans le texte précédent. Pour que vous ne soyez pas mal compris, il est toujours utile d’être explicite sur la réponse que vous proposez. (+1 pour la réponse améliorée, BTW)
whuber

3
En effet, quelle que soit votre confiance en vos ingénieurs, il n’est pas vraiment surprenant que, si vous observez essais sans échec, vous devez vous attendre en moyenne à environ échecs lors des essais suivants, et vous attendez donc au moins un échec avec probabilité , qui est approximativement pour petit . Ainsi, 100 000 essais réussis donnent une probabilité d'environ 10% d'au moins un échec d'ici 10 000 essais. k k n 1 - e - k k kn1kkn1ekkk
Ilmari Karonen

2
@whuber Votre hypothèse selon laquelle le préalable n'a pas d'importance n'est pas vraie dans le cas de zéro échec. Cela dépend fortement de la pente proche de zéro, par exemple l'uniforme antérieur avant (beta 1,1) et le précédent de Jeffreys (beta 0.5, 0.5) donneront un postérieur sensiblement différent.
Erik

12

Plutôt que de calculer une probabilité, pourquoi ne pas prédire combien de produits pourraient échouer?

Modéliser les observations

Il y a produits sur le terrain et un autre à l'étude. Supposons que leurs échecs sont tous indépendants et constants avec une probabilité .m = 10000 pn=100000m=10000p

Nous pouvons modéliser cette situation à l’aide d’une expérience binomiale: sur une boîte de billets avec une proportion inconnue de billets "échec" et "billets" de réussite, tirage billets (avec remplacement, de sorte que le risque d'échec reste le même). Compter les échecs parmi les premiers billets - Que ce soit --et compter les échecs parmi les autres billets, appeler que .1 - p m + n = 110000 n X m Yp1pm+n=110000nXmY

Cadrer la question

En principe, et pourraient être n'importe quoi. Ce qui nous intéresse, c’est le risque que sachant que (avec n’importe quel nombre dans ). Étant donné que les échecs peuvent se produire partout parmi les des billets, avec toutes les configurations possibles ayant la même chance, il se trouve en divisant le nombre de -subsets de choses par le nombre de -subsets de tous choses:0 Y m Y = u X + Y = u u { 0 , 1 , , m } n + m u m u n + m0Xn0YmY=u X+Y=uu{0,1,,m}n+mumun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

Des formules comparables peuvent être utilisées pour le calcul lorsqueX=1,2,.

Une limite supérieure de prédiction1α (UPL) pour le nombre d'échecs dans ces derniers tickets, , est donnée par le plus petit (selon ) pour lequel . t α (X;n,m)uXp(u;n,m)αmtα(X;n,m)uXp(u;n,m)α

Interprétation

La valeur UPL doit être interprétée en termes de risque utilisation de , évalué avant l' observation de ou de En d'autres termes, supposons qu'il y a un an et que l'on vous demande de recommander une procédure permettant de prédire le nombre d'échecs dans les produits suivants une fois que les premiers ont été observés. Votre client demandetαXYmn

Quelles sont les chances pour que votre procédure soit sous-prédite par ? Je ne veux pas dire dans le futur après que vous ayez plus de données; Je veux dire en ce moment, parce que je dois prendre des décisions tout de suite et que les seules chances que j’aurai à ma disposition sont celles qui peuvent être calculées en ce moment. "Y

Votre réponse peut être,

À l'heure actuelle, la probabilité n'est pas supérieure à , mais si vous prévoyez d'utiliser une prédiction plus petite, la probabilité dépassera .αα

Résultats

Pour , et nous pouvons calculer quen=105m=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

Ainsi, après avoir observéX=0 ,

  • Pour un maximum de confiance de (c'est-à-dire lorsque ), prédisez qu'il y a au plus défaillance sur produits.9,1 % α t α ( 0 , n , m ) = 1 10 , 0001α=90.9%9.1%αtα(0;n,m)=110,000

  • Pour un maximum de confiance de (c'est-à-dire lorsque ), prédisez qu'il y a au plus défaillances dans les prochains produits.0,8 % α < 9,1 % t α ( 0 , n , m ) = 2 10 , 00099.2%0.8%α<9.1%tα(0;n,m)=210,000

  • Etc.


commentaires

Quand et pourquoi cette approche s'appliquerait-elle? Supposons que votre entreprise fabrique beaucoup de produits différents. Après avoir observé la performance de de chacun sur le terrain, il aime produire des garanties, telles que "le remplacement complet et gratuit de toute défaillance en l'espace d'un an". En fixant des limites de prévision pour le nombre d'échecs, vous pouvez contrôler le coût total de la sauvegarde de ces garanties. Étant donné que vous fabriquez de nombreux produits et que vous attendez des échecs dus à des circonstances aléatoires indépendantes de votre volonté, l'expérience de chaque produit sera indépendante. Il est logique de contrôler votre risque à long termeα αn. De temps en temps, vous devrez peut-être payer plus de sinistres que prévu, mais la plupart du temps, vous paierez moins. Si payer plus qu'annoncé peut être ruineux, vous définissez comme extrêmement petit (et vous utiliserez probablement un modèle de défaillance plus sophistiqué également!). Sinon, si les coûts sont minimes, vous pouvez vivre avec une confiance faible ( élevé ). Ces calculs montrent comment équilibrer la confiance et les risques.αα

Notez que nous n'avons pas à calculer la procédure complète . Nous attendons que soit observé, puis effectuons simplement les calculs pour ce particulier (ici, ), comme indiqué ci-dessus. En principe, cependant, nous aurions pu effectuer les calculs pour toutes les valeurs possibles de au départ.X X X = 0 XtXXX=0X

Une approche bayésienne (décrite dans d’autres réponses) est attrayante et fonctionnera bien si les résultats ne dépendent pas beaucoup de l’antérieur. Malheureusement, lorsque le taux d'échec est si faible que très peu (ou pas) d'échecs sont observés, les résultats sont sensibles au choix de prior.


+1, mais ne semble pas être correct. p(0,n,m)=1
amibe dit de réintégrer Monica

1
@COOLSerdash, car et les termes pour ne sont pas égaux à zéro. up(u,n,m)=1u=1,2...
amibe dit de réintégrer Monica

1
La raison pour laquelle vous obtenez , comme le note @amoeba, est parce que votre n'est pas vraiment , mais plutôt (et devrait donc vraiment être noté, par exemple, ou quelque chose comme ça). J'ai du mal à comprendre exactement ce que vous faites avec cela par la suite, mais je suis à peu près sûr que quoi qu'il en soit, ce n'est malheureusement pas une solution correcte au problème posé. up(u;n,m)>1p(u;n,m)=(mu)(n+mu)Pr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)
Ilmari Karonen

1
@IlmariKaronen Merci pour vos commentaires. Vous avez raison de dire que j’aurais dû caractériser un peu plus clairement, car ce n’est pas une distribution de probabilité sur c’est une probabilité conditionnelle - mais je crois que la réponse elle-même est néanmoins correcte et que Je suis très confiant que cette approche de calcul des limites de prévision est à la fois correcte et conventionnelle. Je vais éditer ce post pour clarifier ces points. p(u;n,m)u
whuber

1
@Ilmari J'ai déjà effectué l'édition - vous pouvez la voir dans l'historique d'édition. Je suppose que pas de prieurs et appliquer seulement la définition d'un intervalle de prédiction à ce problème. Si vous souhaitez contester si cela est «statistiquement significatif», alors vous vous retrouverez à contester de manière quichotiquement cette construction standard. Voir, par exemple, Hahn & Meeker, Statistical Intervals (J. Wiley, 1991).
whuber

9

Ce qui suit est une réponse bayésienne à "Sur 10 000 nouveaux produits, combien devraient échouer si les 100 000 anciens produits produits n'échouaient pas?", Mais vous devez tenir compte de la sensibilité à différents antécédents.

Supposons que soient conditionnellement indépendants et distribués de manière identique, sous , tels que , et utilisent le conjugué avant , avec .X1,,XnΘ=θX1Θ=θBernoulli(θ)ΘBeta(a,b)a,b>0

Pour , nous avons m<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

Pour , nous avons dans lequel nous avons utilisé .m+1in

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ΘX1=0,,Xm=0Beta(a,m+b)

Brancher vos numéros, avec un uniforme avant ( ) vous attendez un taux d'échec d' environ , tandis qu'un Jeffreys comme avant ( ) vous donne un taux d'échec proche de .a=1,b=110%a=1/2,b=1/25%

Cette attente prédictive ne semble pas être un bon résumé, car la distribution prédictive est très asymétrique. Nous pouvons aller plus loin et calculer la distribution prédictive. Depuis conditionnant comme nous le faisions avant que nous ayons pour .

i=m+1nXi|Θ=θBin(nm+2,θ),
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

Je finirai plus tard en calculant un intervalle prédictif de .95%


3
+1 pour démontrer que le résultat est sensible à la forme du précédent proche de 0. (Il est intéressant de noter que, puisque la fonction de vraisemblance est fortement concentrée près de zéro lorsque est grand, c'est la seule partie du précédent qui compte vraiment. Par exemple, pour un prior, l'espérance est approximativement proportionnelle à , mais presque indépendante de . un préalable uniforme, peu importe que le précédent soit ou , mais les choses changeraient radicalement si nous un précédent comme .)mBeta(a,b)am+a+bamabU(0,1)U(0,0.01)U(0.01,1)
Ilmari Karonen

6

En utilisant l' approche sunrise de Laplace , nous obtenons la probabilité qu'un produit échoue dans un délai de un an . Ensuite, la probabilité que nouveaux produits n'échoue pas au cours d'une année est de Par conséquent, la probabilité qu'au moins un produit de échoue l'année prochaine est Pour la valeur est . Dans le cas de whiber , assez élevé, en fait.

p=1100000+1
n
(1p)n
n
1(11100001)n
n=10000P100000.095P2000000.87

Bien sûr, vous devez continuer à mettre à jour vos données pendant que plus de produits sont vendus.


Cette réponse semble être incorrecte: le calcul pour un lever de soleil futur ne s’étend pas simplement par multiplication. Après tout, supposons que le nombre soit remplacé par . Souhaitez-vous affirmer que la probabilité d'échec est ?? Vous devriez comparer votre réponse à l'analyse de la réponse de Yair Daon et aux commentaires correspondants. 10,000200,000200000/1000012
whuber

@whuber, corrigé
Aksakal

1
(1) Soit vous avez mal calculé ou votre "200000" est une faute de frappe pour "20000". (Vous devriez obtenir environ .) (2) Votre analyse reproduit maintenant une partie des conclusions de Yair Daon, mais sans l’avantage de produire la distribution postérieure complète. 0.865
whuber

@whuber, oui c'était un de moins zéro
Aksakal

5

Plusieurs bonnes réponses ont été fournies à cette question, mais récemment, j’ai eu l’occasion de passer en revue quelques ressources sur ce sujet et j’ai donc décidé de partager les résultats.

Il existe plusieurs estimateurs possibles pour les données sans échec. Notons en nombre d'échecs et en taille d'échantillon. Estimateur de vraisemblance maximale pour la probabilité d'échec étant donné que ces données sontk=0n

(1)P(K=k)=kn=0

Cette estimation est plutôt peu satisfaisante car le fait que nous n'ayons observé aucune défaillance de notre échantillon ne prouve guère qu'elles sont impossibles en général. Des connaissances en dehors des données suggèrent qu'il existe une probabilité d'échec même si non observé (encore). Avoir des connaissances a priori nous conduit à utiliser les méthodes bayésiennes recensées par Bailey (1997), Razzaghi (2002), Basu et al (1996), et Ludbrook et Lew (2009).

Parmi les estimateurs simples, l’estimateur "limite supérieur" qui suppose (Bailey, 1997)

qu'il ne serait pas logique pour un estimateur pour P dans le cas zéro défaut d'obtenir une probabilité supérieure à celle prédite par l'estimateur du maximum de vraisemblance dans le cas un échec, une limite supérieure raisonnable

défini comme

(2)1n

peut être mentionné. Tel que examiné par Ludbrook et Lew (2009), d'autres possibilités sont "la règle des trois" (cf. ici , Wikipedia , ou Eypasch et al, 1995).

(3)3n

ou d'autres variations:

(4)3n+1

"règle de 3.7" par Newcombe et Altman (ou par 3.6):

(5)3.7n

"nouvelle règle de quatre":

(6)4n+4

mais comme conclu par Ludbrook et Lew (2009), "la règle des trois" est "presque inutile" et la "règle de 3.6" (et 3.7) "a de sérieuses limitations - elles sont extrêmement inexactes si la taille initiale de l'échantillon est inférieure à 50" et ils ne recommandent pas les méthodes (3) - (6), suggérant plutôt d'utiliser des estimateurs bayésiens appropriés (voir ci-dessous).

Parmi les estimateurs bayésiens, plusieurs différents peuvent être mentionnés. Le premier estimateur de ce type suggéré par Bailey (1997) est

(7)10.51n

pour estimer la médiane sous uniforme avant

(8)10.51n+1

ou pour estimer moyenne sous un tel préalable

(9)1n+2

encore une autre approche basée sur un modèle de défaillance exponentiel à taux de défaillance constant (distributions de Poisson)

(10)1/3n

si nous utilisons la version bêta antérieure avec les paramètres et nous pouvons utiliser la formule (voir Razzaghi, 2002):bab

(11)aa+b+n

que sous mène à un préalable uniforme (9). En supposant que Jeffreys a priori avec cela conduit àa = b = 0,5a=b=1a=b=0.5

(12)12(n+1)

En règle générale, les formules bayésiennes (7) - (12) sont recommandées. Basu et al (1996) recommandent (11) avec une information préalable, lorsque certaines connaissances a priori sont disponibles. Étant donné qu’il n’existe pas de meilleure méthode, je vous suggère de consulter la littérature avant votre analyse, en particulier lorsque est petit.n


Bailey, RT (1997). Estimation à partir de données sans défaillance. Analyse de risque, 17 , 375-380.

Razzaghi, M. (2002). Sur l'estimation de la probabilité de succès binomiale avec une occurrence nulle dans l'échantillon. Journal of Modern Applied Statistical Methods, 1 (2), 41.

Ludbrook, J. et Lew, MJ (2009). Estimation du risque de complications rares: la «règle de trois» est-elle suffisante? Journal de chirurgie ANZ, 79 (7‐8), 565-570.

Eypasch, E., Lefering, R., Kum, CK et Troidl, H. (1995). Probabilité que des événements indésirables ne se soient pas encore produits: un rappel statistique. BMJ 311 (7005): 619 à 620.

Basu, AP, Gaylor, DW et Chen, JJ (1996). Estimation de la probabilité d'occurrence de la tumeur pour un cancer rare à occurrence nulle dans un échantillon. Toxicologie et pharmacologie réglementaires, 23 (2), 139-144.


1
Excellente critique de ce qui existe!
AlefSin

Pour les commentaires commençant par "parmi les estimateurs bayésiens plusieurs ...", il n'est généralement pas clair si un commentaire donné se rapporte à la formule située au-dessus ou au-dessous. Pouvez-vous rendre cela plus clair?
gung - Réintégrer Monica

2

Vous devez vraiment revenir aux concepteurs de vos produits. C'est un problème d'ingénierie fondamental et non pas un problème statistique d'observation. Ils auront une idée de la probabilité de défaillance de chaque composant et de la probabilité de défaillance nette du produit assemblé total. Ils peuvent vous donner le nombre attendu de défaillances sur toute la durée de vie du produit.

Un ingénieur civil conçoit un pont pour une durée de vie théorique de 120 ans. Chaque composant du pont a un léger risque d'échec. Chaque chargement a une légère chance d'être dépassé. Pour rendre le pont économique à construire, un effondrement total ne se produirait qu'une fois tous les 2400 ans, ce qui est beaucoup plus long que le pont ne sera entretenu. Il n’est pas surprenant que le pont n’échoue pas en 1ère année, ni en 2ème année à l’année 120. Cela ne vous a pas effondré vous en dit très peu. Ses diverses chances d’échec dans le temps ne peuvent être estimées que par les concepteurs d’origine.


0

Ce problème est similaire à un problème auquel j'ai été confronté lorsque nous avons introduit un nouveau processus de fabrication afin d'éliminer un échec de la production.

Le nouveau système ne produisant aucun échec, les gens se posaient la même question: comment prédire le taux d'échec? Dans votre cas, comme vous avez stipulé une période au cours de laquelle la défaillance peut survenir sans se soucier du moment où la défaillance survient au cours de cette période, les effets temporels ont été supprimés. Et il s’agit simplement de savoir si quelque chose a échoué ou non. Avec cela stipulé - avec ma réponse.

Intuitivement, il semble que nous ayons besoin d'au moins un échec pour pouvoir calculer le taux d'échec. Cependant, cette hypothèse comporte une erreur implicite. Nous ne calculerons jamais le taux d'échec. C'est parce que nous avons affaire à un échantillon. Nous ne pouvons donc qu'estimer une fourchette de taux d'échec probables. Pour ce faire, vous devez trouver une distribution correspondant au taux d'échec. La distribution qui fait le travail dans cet exemple est une distribution Beta où les paramètres sont: α = n + 1 et β = N - n + 1

Remarque: N est la taille de l'échantillon et n le nombre d'échecs (dans votre cas 0)

Pour votre scénario, la distribution du taux d'échec est indiquée ci-dessous. entrez la description de l'image ici .

Vous introduirez ensuite cette distribution dans la formule de probabilité binomiale respective pour obtenir une distribution de la probabilité d'échec d'une unité (peut être effectuée de manière analytique ou à l'aide de la méthode de Monte Carlo). Je soupçonne que les chiffres seront très faibles.

Notez que ce processus est applicable quel que soit le nombre de défaillances de votre premier jeu.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.