Il s'agit d'une situation simple; gardons-le ainsi. La clé est de se concentrer sur ce qui compte:
Obtention d'une description utile des données.
Évaluer les écarts individuels par rapport à cette description.
Évaluer le rôle et l'influence possibles du hasard dans l'interprétation.
Maintenir l'intégrité intellectuelle et la transparence.
Il y a encore beaucoup de choix et de nombreuses formes d'analyse seront valides et efficaces. Illustrons ici une approche qui peut être recommandée pour son adhésion à ces principes clés.
Pour maintenir l'intégrité, divisons les données en deux: les observations de 1972 à 1990 et celles de 1991 à 2009 (19 ans chacune). Nous ajusterons les modèles à la première moitié et verrons ensuite dans quelle mesure les ajustements fonctionnent dans la projection de la seconde moitié. Cela a l'avantage supplémentaire de détecter des changements importants qui peuvent s'être produits au cours du second semestre.
Pour obtenir une description utile, nous devons (a) trouver un moyen de mesurer les changements et (b) adapter le modèle le plus simple possible approprié à ces changements, l'évaluer et adapter itérativement des modèles plus complexes pour tenir compte des écarts par rapport aux modèles simples.
(a) Vous avez plusieurs choix: vous pouvez consulter les données brutes; vous pouvez regarder leurs différences annuelles; vous pouvez faire de même avec les logarithmes (pour évaluer les changements relatifs); vous pouvez évaluer les années de vie perdues ou l'espérance de vie relative (EFR); ou bien d'autres choses. Après réflexion, j'ai décidé de considérer le RLE, défini comme le rapport de l'espérance de vie dans la cohorte B par rapport à celui de la (référence) cohorte A. Heureusement, comme les graphiques le montrent, l'espérance de vie dans la cohorte A augmente régulièrement dans une écurie mode au fil du temps, de sorte que la plupart des variations d’apparence aléatoire dans le RLE seront dues à des changements dans la cohorte B.
(b) Le modèle le plus simple possible pour commencer est une tendance linéaire. Voyons comment cela fonctionne.
Les points bleu foncé dans ce graphique sont les données retenues pour l'ajustement; les points d'or clair sont les données suivantes, non utilisées pour l'ajustement. La ligne noire est l'ajustement, avec une pente de .009 / an. Les lignes en pointillés sont des intervalles de prédiction pour les valeurs futures individuelles.
Dans l'ensemble, l'ajustement semble bon: l' examen des résidus (voir ci-dessous) ne montre aucun changement important dans leur taille au fil du temps (pendant la période de données 1972-1990). (Il semblerait qu'elles aient eu tendance à être plus importantes au début, lorsque l'espérance de vie était faible. Nous pourrions gérer cette complication en sacrifiant une certaine simplicité, mais les avantages pour estimer la tendance ne devraient pas être grands.) de corrélation sérielle (manifestée par certains cycles de résidus positifs et négatifs), mais il est clair que cela n'a pas d'importance. Il n'y a pas de valeurs aberrantes, ce qui serait indiqué par des points au-delà des bandes de prédiction.
La seule surprise est qu'en 2001, les valeurs sont soudainement tombées dans la bande de prédiction inférieure et y sont restées: quelque chose d'assez soudain et de grand s'est produit et a persisté.
Voici les résidus, qui sont les écarts par rapport à la description mentionnée précédemment.
Parce que nous voulons comparer les résidus à 0, les lignes verticales sont tracées au niveau zéro comme aide visuelle. Encore une fois, les points bleus montrent les données utilisées pour l'ajustement. Les or clair sont les résidus des données se rapprochant de la limite de prédiction inférieure, après 2000.
À partir de ce chiffre, nous pouvons estimer que l'effet du changement 2000-2001 était d'environ -0,07 . Cela reflète une baisse soudaine de 0,07 (7%) d'une durée de vie complète au sein de la cohorte B. Après cette baisse, le schéma horizontal des résidus montre que la tendance précédente s'est poursuivie, mais au nouveau niveau inférieur. Cette partie de l'analyse doit être considérée comme exploratoire : elle n'a pas été spécifiquement planifiée, mais est due à une comparaison surprenante entre les données retenues (1991-2009) et l'adéquation avec le reste des données.
Une autre chose - même en utilisant seulement les 19 premières années de données, l'erreur standard de la pente est petite: elle n'est que de 0,0009, juste un dixième de la valeur estimée de .009. La statistique t correspondante de 10, avec 17 degrés de liberté, est extrêmement significative (la valeur p est inférieure à ); c'est-à-dire que nous pouvons être certains que la tendance n'est pas due au hasard. Ceci est une partie de notre évaluation du rôle du hasard dans l'analyse. Les autres parties sont les examens des résidus.10−7
Il ne semble pas y avoir de raison d'adapter un modèle plus compliqué à ces données, du moins pas dans le but d'estimer s'il existe une véritable tendance dans le RLE au fil du temps: il y en a une. Nous pourrions aller plus loin et diviser les données en valeurs antérieures à 2001 et postérieures à 2000 afin d'affiner nos estimationsdes tendances, mais il ne serait pas tout à fait honnête de procéder à des tests d'hypothèse. Les valeurs de p seraient artificiellement faibles, car les tests de fractionnement n'étaient pas planifiés à l'avance. Mais comme exercice exploratoire, une telle estimation est très bien. Apprenez tout ce que vous pouvez de vos données! Faites juste attention à ne pas vous tromper avec un sur-ajustement (ce qui est presque sûr de se produire si vous utilisez plus d'une demi-douzaine de paramètres ou si vous utilisez des techniques d'ajustement automatisées), ou l'espionnage des données: restez attentif à la différence entre la confirmation formelle et informelle (mais précieux) exploration de données.
Résumons:
En sélectionnant une mesure appropriée de l'espérance de vie (RLE), en conservant la moitié des données, en ajustant un modèle simple et en testant ce modèle par rapport aux données restantes, nous avons établi avec une grande confiance que : il y avait une tendance cohérente; il a été proche du linéaire sur une longue période de temps; et il y a eu une baisse soudaine et persistante du RLE en 2001.
Notre modèle est étonnamment parcimonieux : il ne nécessite que deux nombres (une pente et une intersection) pour décrire avec précision les premières données. Il en faut un tiers (date de la rupture, 2001) pour décrire un écart évident mais inattendu de cette description. Il n'y a pas de valeurs aberrantes par rapport à cette description à trois paramètres. Le modèle ne va pas être sensiblement amélioré en caractérisant la corrélation sérielle (l'objectif des techniques de séries chronologiques en général), en essayant de décrire les petits écarts individuels (résidus) présentés ou en introduisant des ajustements plus compliqués (comme l'ajout d'une composante temporelle quadratique). ou la modélisation des changements dans la taille des résidus au fil du temps).
La tendance est de 0,009 RLE par an . Cela signifie qu'avec chaque année qui passe, l'espérance de vie au sein de la cohorte B s'est enrichie de 0,009 (près de 1%) d'une durée de vie normale attendue. Au cours de l'étude (37 ans), cela équivaudrait à 37 * 0,009 = 0,34 = un tiers d'une amélioration à vie. Le recul de 2001 a réduit ce gain à environ 0,28 d'une vie entière de 1972 à 2009 (même si pendant cette période l'espérance de vie globale a augmenté de 10%).
Bien que ce modèle puisse être amélioré, il aurait probablement besoin de plus de paramètres et il est peu probable que l'amélioration soit grande (comme l'atteste le comportement quasi aléatoire des résidus). Dans l'ensemble, nous devrions donc nous contenter d'arriver à une description aussi compacte, utile et simple des données pour si peu de travail analytique.