Une chose à garder à l'esprit avec la courbe de survie de Kaplan-Meier est qu'elle est essentiellement descriptive et non inférentielle . C'est juste une fonction des données, avec un modèle incroyablement flexible qui se cache derrière. C'est une force car cela signifie qu'il n'y a pratiquement pas d'hypothèses qui pourraient être brisées, mais une faiblesse car il est difficile de la généraliser, et qu'elle convient aussi bien au «bruit» qu'au «signal». Si vous voulez faire une inférence, vous devez essentiellement introduire quelque chose d'inconnu que vous souhaitez savoir.
Maintenant, une façon de comparer les temps de survie médians est de faire les hypothèses suivantes:
- J'ai une estimation du temps de survie médian pour chacun des i états, donnée par la courbe de kaplan meier.tjeje
- Je m'attends à ce que le vrai temps de survie médian, soit égal à cette estimation. E ( T i | t i ) = t iTjeE( Tje| tje) = tje
- Je suis certain à 100% que la vraie durée médiane de survie est positive. Pr ( Tje> 0 ) = 1
Maintenant, la façon "la plus conservatrice" d'utiliser ces hypothèses est le principe d'entropie maximale, vous obtenez donc:
p ( Tje| tje) = Ke x p ( - λ Tje)
Où et λ sont choisis de telle sorte que le PDF est normalisé et que la valeur attendue est t i . Maintenant nous avons:Kλtje
= K [ - e x p ( - λ T i )
1 = ∫∞0p ( Tje| tje) dTje= K∫∞0e x p ( - λ Tje) dTje
et maintenant nous avons
E ( T i ) = 1= K[ - e x p ( - λ Tje)λ]Tje= ∞Tje= 0= Kλ⟹K= λ
E( Tje) = 1λ⟹λ = t- 1je
Et vous avez donc un ensemble de distributions de probabilité pour chaque état.
p ( Tje| tje) = 1tjee x p ( - Tjetje)( i = 1 , … , N)
Qui donnent une distribution de probabilité conjointe de:
p ( T1, T2, … , TN| t1, t2, … , TN) = ∏i = 1N1tjee x p ( - Tjetje)
H0: T1= T2= ⋯ = TN= t¯t¯= 1N∑Ni = 1tjeHUNE: T1= t1, … , TN= tN
O ( HUNE| H0) = p ( T1= t1, T2= t2, … , TN= tN| t1, t2, … , TN)p ( T1= t¯, T2= t¯, … , TN= t¯| t1, t2, … , TN)
= [ ∏Ni = 11tje] exp ( - ∑Ni = 1tjetje)[ ∏Ni = 11tje] exp ( - ∑Ni = 1t¯tje)= e x p ( N[ t¯th a r m- 1 ] )
Où
th a r m= [ 1N∑i = 1Nt- 1je]- 1≤ t¯
est la moyenne harmonique. Notez que les probabilités favoriseront toujours l'ajustement parfait, mais pas beaucoup si les durées médianes de survie sont raisonnablement proches. De plus, cela vous donne un moyen direct d'énoncer les preuves de ce test d'hypothèse particulier:
O ( HUNE| H0) : 1
Combinez cela avec une règle de décision, une fonction de perte, une fonction d'utilité, etc. qui indique à quel point il est avantageux d'accepter l'hypothèse plus simple, et vous avez votre conclusion!
H0
HS, je: Tje= tje, Tj= T= t¯( i )= 1N- 1∑j ≠ itj
je
- HUNEHS, je
- H0HS, je
- HS, kkje
Maintenant, une chose qui a été négligée ici est les corrélations entre les états - cette structure suppose que la connaissance du taux de survie médian dans un état ne vous dit rien sur le taux de survie médian dans un autre état. Bien que cela puisse sembler "mauvais", il n'est pas difficile de s'améliorer et les calculs ci-dessus sont de bons résultats initiaux faciles à calculer.
L'ajout de connexions entre les états modifiera les modèles de probabilité, et vous verrez effectivement une "mise en commun" des temps de survie médians. Une façon d'incorporer des corrélations dans l'analyse consiste à séparer les temps de survie réels en deux composantes, une "partie commune" ou "tendance" et une "partie individuelle":
Tje= T+ Uje
Ujeσ