Dans Thinking, Fast and Slow , Daniel Kahneman pose la question hypothétique suivante:
(P. 186) Julie est actuellement senior dans une université d'État. Elle lisait couramment quand elle avait quatre ans. Quelle est sa moyenne pondérée cumulative (moyenne cumulative)?
Son intention est d'illustrer comment nous ne tenons souvent pas compte de la régression vers la moyenne lorsque nous faisons des prédictions sur certaines statistiques. Dans la discussion qui a suivi, il conseille:
(P. 190) Rappelons que la corrélation entre deux mesures - en l'occurrence l'âge de lecture et l'AMP - est égale à la proportion de facteurs partagés parmi leurs déterminants. Quelle est votre meilleure estimation de cette proportion? Ma supposition la plus optimiste est d'environ 30%. En supposant cette estimation, nous avons tout ce dont nous avons besoin pour produire une prédiction non biaisée. Voici les instructions pour vous y rendre en quatre étapes simples:
- Commencez avec une estimation de la moyenne GPA.
- Déterminez l'AMP qui correspond à votre impression des preuves.
- Estimer la corrélation entre la précocité de lecture et GPA.
- Si la corrélation est de 0,30, déplacez 30% de la distance de la moyenne au GPA correspondant.
Mon interprétation de ses conseils est la suivante:
- Utilisez «Elle lisait couramment quand elle avait quatre ans» pour établir un score standard pour la précocité de lecture de Julie.
- Déterminez un GPA qui a un score standard correspondant. (Le GPA rationnel à prévoir correspondrait à ce score standard si la corrélation entre le GPA et la précocité de lecture était parfaite.)
- Estimer quel pourcentage de variations de GPA peut être expliqué par des variations de précocité de lecture. (Je suppose qu'il fait référence au coefficient de détermination avec "corrélation" dans ce contexte?)
- Parce que seulement 30% du score standard de la précocité de lecture de Julie peut être expliqué par des facteurs qui peuvent également expliquer le score standard de son GPA, nous ne pouvons que prédire que le score standard du GPA de Julie sera de 30% de ce qu'il serait. en cas de corrélation parfaite.
Mon interprétation de la procédure de Kahneman est-elle correcte? Si oui, existe-t-il une justification mathématique plus formelle de sa procédure, en particulier l'étape 4? En général, quelle est la relation entre la corrélation entre deux variables et les changements / différences dans leurs scores standard?