Cela peut être utile pour certaines personnes partageant la même compréhension intuitive. Nous avons tous vu quelque chose comme ça:
Ces données sont vraisemblablement indépendantes mais présentent clairement une corrélation (r = 0,66). "Je pensais que l'indépendance implique une corrélation nulle!" dit l'élève.
Comme d'autres l'ont déjà souligné, les valeurs de l' échantillon sont corrélées, mais cela ne signifie pas que la population présente une corrélation non nulle.
Bien sûr, ces deux devraient être indépendants - étant donné que Nicolas Cage est apparu dans un record de 10 films cette année, nous ne devrions pas fermer la piscine locale pour l'été pour des raisons de sécurité.
Mais quand on vérifie combien de personnes se noient cette année, il y a une petite chance qu'un record de 1000 personnes se noie cette année.
Une telle corrélation est peu probable. Peut-être un sur mille. Mais c'est possible, même si les deux sont indépendants. Mais ce n'est qu'un cas. Considérez qu'il y a des millions d'événements possibles à mesurer, et vous pouvez voir la chance que la probabilité que deux se produisent pour donner une corrélation élevée est assez élevée (d'où l'existence de graphiques tels que celui ci-dessus).
Une autre façon de voir les choses est que garantir que deux événements indépendants donneront toujours des valeurs non corrélées est lui-même restrictif. Étant donné deux dés indépendants et les résultats du premier, il existe un certain ensemble de résultats (assez important) pour le deuxième dé qui donnera une corrélation non nulle. Limiter les résultats du deuxième dé pour ne donner aucune corrélation avec le premier est une violation flagrante de l'indépendance, car les lancers du premier dés affectent désormais la distribution des résultats.