Vous pouvez toujours estimer les paramètres en utilisant directement la vraisemblance. Soit les observations avec la distribution exponentielle de taux λ > 0 et inconnue. La fonction de densité est f ( x ; λ ) = λ e - λ x , la fonction de distribution cumulative F ( x ; λ ) = 1 - e - λ x et la fonction de queue G ( x ; λX1, … , Xnλ > 0F( x ; λ ) = λ e- λ xF( x ; λ ) = 1 - e- λ x . Supposons que les premières r observations sont pleinement observées, tandis que pour x r + 1 , … , x n, nous savons seulement que x j > t j pour certaines constantes positives connues t j . Comme toujours, la vraisemblance est la "probabilité des données observées", pour les observations censurées, donnée par P ( X j > t jG ( x ; λ ) = 1 - F( x ; λ ) = e- λ xrXr + 1, … , XnXj> tjtj , donc la fonction de vraisemblance complète est
L ( λ ) = r ∏ i = 1 f ( x i ; λ ) ⋅ n ∏ i = r + 1 G ( t j ; λ )
La loglik vraisemblance devient alors
l ( λ ) = r log λ - λ ( xP( Xj> tj) = G ( tj; λ )
L ( λ ) = ∏i = 1rF( xje; λ ) ⋅ ∏i = r + 1nG ( tj; λ )
qui a la même forme que la loglik vraisemblance pour le cas habituel entièrement observé, sauf à partir du premier terme
r log λ au lieu de
n log λ . L' écriture
T pour la moyenne des observations ettempscensure, l'estimateur devraisemblance maximale de
λ devient
λ = rl ( λ ) = r logλ - λ ( x1+ ⋯ + xr+ tr + 1+ ⋯ + tn)
r logλn journalλTλ , que vous pouvez vous-même comparer avec le cas pleinement observé.
λ^=rnT
EDIT
r=0
l(λ)=−nTλ
λλ=0λλ
Mais, dans tous les cas, la véritable conclusion des données dans ce cas est que nous devrions attendre plus de temps pour obtenir certains événements ...
λe−λnTpnp[p¯,1]λlogp=−λT
p
P(X=n)=pn≥0.95 (say)
nlogp≥log0.95λλ≤−log0.95nT.