Vue d'ensemble sur l'analyse de survie et l'analyse des données de vie


10

J'ai entendu parler de l'analyse de la survie et de l'analyse des données de la vie, mais je n'ai pas une vue d'ensemble.

Je me demandais quels sujets ils couvrent?

S'agit-il de statistiques pures ou simplement d'application de statistiques sur un domaine spécifique?

L'analyse de la date de vie fait-elle partie de l'analyse de la survie?

Merci et salutations!

Réponses:


12

Le concept de censure est la clé de l'analyse de survie et de l'analyse des données de vie. Ce problème peut également entrer via les statistiques industrielles. Lors de la surveillance du temps nécessaire à un échantillon d'unités pour échouer, vous pouvez avoir

  • Données complètes: l'heure exacte à laquelle une unité tombe en panne est connue
  • Censuré à droite: le temps d'échec d'une unité dépasse le temps d'exécution actuel
  • Censuré à gauche: l'heure connue est postérieure à la panne d'une unité

D'autres problèmes qui entrent dans le mélange de données sont

  • Censure unique: toutes les unités non défaillantes ont un temps d'exécution commun
  • Multipliez la censure: les unités non défaillantes ont des temps d'exécution différents
  • Intervalle censuré: le temps d'échec est connu pour être entre un ensemble particulier d'heures.
  • Temps censuré: le temps de censure est fixe
  • Échec censuré: un test est arrêté lorsqu'un nombre fixe d'unités échoue
  • Modes de défaillance concurrents: les unités d'échantillonnage échouent pour différentes raisons

Les distributions courantes capables de gérer ces situations sont: lognormal, Weibull et extreme value. Les problèmes deviennent intéressants car il existe des procédures graphiques pour gérer l'analyse ainsi que les méthodes MLE et Method of Moments.

La fiabilité des systèmes est une conséquence de ce sujet qui s'intéresse aux méthodes bayésiennes, à la théorie du renouvellement et aux tests de durée de vie accélérée. Wayne Nelson et Bill Meeker ont plusieurs bons livres sur les sujets.


3
(+1) La censure est l'idée clé; le temps n'est qu'une application particulière (et la plus courante). Par exemple, Dennis Helsel a appliqué l'analyse de survie à des mesures chimiques ayant des limites de détection (censure à gauche). Il n'y a pas de temps, mais le modèle et les techniques sont toujours utiles.
whuber

8

À propos de l'analyse de survie

Dans l'analyse de survie, ou l'analyse de la durée de l'événement, la variable ou l'intérêt mesure le temps entre un point de départ et un point d'intérêt comme la mort due à une maladie. La variable de réponse est donc une variable positive qui, dans la plupart des cas, est asymétrique. En conséquence, l'hypothèse habituelle de normalité échoue et, par exemple, les techniques de régression classiques ne sont pas applicables. (Cependant, notez que parfois une transformation de la variable pourrait améliorer la situation). Mais la principale différence est la censure : une caractéristique très courante lors du traitement des données de délai. Dans sa forme la plus courante (censure à droite), vous ne connaissez pas l'heure exacte pour un individu donné mais vous savez qu'elle est supérieure à une valeur . Par exemple, supposons que vous suiviez un patient jusqu'à sa mort. Au moment t = 10 t = 30 t > 30 t = 30tt=10 jours, il est vivant. Au temps jours, il est toujours en vie, mais il est perdu de vue. Alors vous ne connaissez pas l'heure exacte de la mort mais vous savez que . Ignorer la censure n'est clairement pas la meilleure chose à faire; à la place, vous pouvez enregistrer comme observation censurée. Les techniques d'analyse de survie (par exemple, estimateur de Kaplan-Meier, régression de Cox, ...) sont spécialement conçues pour gérer la censure.t=30t>30t=30

À mon avis, la modélisation des données de survie dans la recherche médicale est un très bon choix comme premier livre d'analyse de survie ... mais il y en a beaucoup d'autres.


2
5, 10, 12+, 14, 17, 18+, 20+

Une première description approximative de l'analyse de survie: Analyse des données où la variable dépendante a (1) des valeurs précises (les observations complètes) et (2) des valeurs connues pour être supérieures à un seuil donné (les observations censurées). Ce qui précède peut être un échantillon de données de survie, les valeurs sans +sont connues avec précision; les valeurs avec +sont connues pour être plus, mais pas combien plus. (Et il existe de nombreuses extensions.)


1

Comme l'a souligné schenectady, la censure est le problème clé de l'analyse de survie. Sans observations censurées dans votre jeu de données, votre tâche n'a aucune différence avec une simple tâche de régression. Cela suggère également que la variable d'intérêt n'est pas limitée au temps , c'est- à - dire qu'elle peut être le salaire, le prix, etc.T

Par conséquent, il peut être plus approprié d'appeler cela une régression de censure ou une analyse de censure, au lieu d'une analyse de survie, je suppose.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.