Comme l'étiquette de survie est utilisée, j'ajouterai une réponse offrant quelques exemples avec une saveur d'analyse de survie.
Point de données
Par point de données, nous entendons simplement une observation, c'est-à-dire le résultat d'une ou plusieurs variables. Par exemple, nous pourrions avoir les éléments suivants dans un ensemble de données: la personne 1 dans notre étude est un homme et décède à 58 ans. Nous pourrions considérer cela comme un point de données. Mais dans votre exemple, il est clair que le point de données se compose uniquement du résultat d'une variable, par exemple 58.
Censure à droite
Si nous modélisons le temps de l'échec, il y a une raison évidente de censure, à savoir que nous n'avons pas nécessairement le temps d'attendre que tous les sujets échouent. Disons que nous testons l'effet des vaccins pour enfants. Si nous devions mener un essai randomisé, le dernier de nos sujets mourrait dans cent ans ou plus à partir de maintenant. Cela introduit naturellement la censure, dans ce cas la censure à droite, car nous aurions à un moment donné à dire "nous ne savons pas combien de temps cette personne vivra, nous savons seulement qu'elle est toujours en vie". Une censure à droite peut également se produire si les personnes participant à l'essai randomisé sont perdues de vue, par exemple, elles peuvent vouloir interrompre leur participation à l'étude ou s'éloigner. Ce sont des exemples de censure à droite, fondamentalement, nous ' Nous nous intéressons à la longévité de nos sujets, mais en raison de circonstances pratiques, nous n'avons que des observations censurées, ce qui signifie que pour certains sujets, nous ne saurons jamais quand ils meurent, mais qu'à un certain moment (le temps de la censure), ils étaient encore en vie. Ainsi, nous savons que pour un individu censuré, le point de données (moment du décès) est supérieur à une certaine valeur (le temps de censure).
Censure à gauche
Comme exemple de censure à gauche, considérez ce qui suit. Disons qu'une troupe de babouins dort toujours dans les arbres. Nous voulons estimer à quelle heure du matin ils descendent des arbres, et supposons qu'ils descendent tous les jours. Nous les suivons pendant plusieurs jours, cependant, nous aimons dormir, ce qui signifie que certains jours, ils descendent avant même d'arriver sur les lieux. Si nous arrivons à 9 h le jour et que les babouins sont déjà descendus, nous avons laissé des données censurées. Nous voulons savoir quand ils sont descendus, mais tout ce que nous avons est une limite supérieure (9 h), car nous savons qu'à notre heure d'arrivée, ils étaient déjà descendus. De façon analogue, nous savons maintenant que le point de données (heure de descente au jour ) est inférieur à une certaine valeur (9 h).xx
Cet exemple est tiré de
Andersen, PK, Borgan, Ø., Gill, RD et Keiding, N. (1993), Statistical Models based on Counting Processes , Springer Series in Statistics, Springer-Verlag, New York.
Ce livre fournit une définition mathématique de la censure et n'est probablement pas le premier livre sur l'analyse de survie à obtenir. Cependant, il contient également quelques exemples intuitifs, comme ci-dessus.