Pourquoi les problèmes de régression sont-ils appelés problèmes de «régression»?


36

Je me demandais simplement pourquoi les problèmes de régression sont appelés problèmes de "régression". Quelle est l'histoire derrière le nom?

Une définition de la régression: "Rechute dans un état moins parfait ou moins développé".


1
Voir le deuxième paragraphe de la section «Histoire» fr..mikikeland.org
Mark White

Réponses:


34

Le terme "régression" a été utilisé par Francis Galton dans son article de 1886 "Régression vers la médiocrité dans la stature héréditaire". À ma connaissance, il n'a utilisé le terme que dans le contexte de la régression vers la moyenne . Le terme a ensuite été adopté par d’autres pour donner plus ou moins le sens qu’il a aujourd’hui en tant que méthode statistique générale.


15
Galton a dérivé une approximation linéaire pour estimer la taille d'un fils à partir de la taille du père dans ce document. Son équation était ajustée de manière à ce qu'un père de taille moyenne ait un fils de taille moyenne, mais un père plus grand que la moyenne aurait un fils plus grand que la moyenne de 2/3 du montant de son père. Même avec plus court que la moyenne. Cela pourrait être considéré comme une simple régression linéaire (signification actuelle). Et bien sûr, la régression actuelle a un sens encore plus large: c'est tout modèle qui fait des prédictions continues. Il est intéressant de voir combien son usage initial de ce mot a changé.
RM999

3
La réponse de NRH est correcte. Le lien suivant donne beaucoup plus de détails sur l'article de Francis Galton "Régression vers la médiocrité au statut
Gaurav Singhal

Le moment est-il venu pour la communauté de la statistique de remplacer le mot «régression» par un terme plus simple et plus clair, peut-être un «prédicteur avec formule»?
Aviad Rozenhek

4

Au lieu de progresser, nous retombons à la moyenne, c’est-à-dire que nous régressons. D'où le terme de régression! Je pense que c'est quelque chose qui a été ramassé et coincé.


2

@ Mark White a déjà mentionné le lien, mais pour ceux d'entre vous qui n'ont pas beaucoup de temps pour vérifier le lien, voici la réponse exacte correctement référencée:

Origine de la "régression"

Le terme "régression" a été inventé par Francis Galton au 19ème siècle pour décrire un phénomène biologique. Le phénomène était que les hauteurs des descendants des grands ancêtres ont tendance à régresser vers une moyenne normale (un phénomène également connu sous le nom de régression vers la moyenne) (Galton, réimprimé en 1989). Pour Galton, la régression n'avait que cette signification biologique (Galton, 1887) , mais Udny Yule et Karl Pearson ont ensuite étendu son travail à un contexte statistique plus général (Pearson, 1903).

Les références

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Lois typiques de l'hérédité. III. Nature, 15 (389), 512-514.

Galton, F. (réimprimé en 1989). Parenté et corrélation. Statistical Science, 4 (2), 80–86.

Pearson, K. (1903). La loi de l'hérédité ancestrale. Biometrika, 2 (2), 211-228.


La régression de Galton, comme dans «régression vers la moyenne», a du sens. Cependant, je ne comprends pas que l'utilisation du mot «régression» signifie «apprendre une formule de variables indépendantes à une variable de résultat»
Aviad Rozenhek

1
Cela signifie plus généralement cela, mais l'apprentissage machine utilise la régression, mais la régression n'est pas une technique d'apprentissage automatique, malgré l'opinion répandue et erronée de l'opinion publique. L’apprentissage statistique est distinct de l’apprentissage automatique, mais en général, les partisans du ML prennent des méthodes statistiques et les qualifient à tort de ML, de sorte que les incongruités apparentes apparaissent. La régression de Galton est la régression; il s'agit de modéliser / prédire une tendance.
LSC

0

"Régression" vient de "régression" qui vient du latin "regressus" - pour revenir (à quelque chose).

En ce sens, la régression est la technique qui permet de "revenir en arrière" de données complexes, difficiles à interpréter, à un modèle plus clair et plus significatif. En tant que physicien, j'aime bien cette idée, car les physiciens voient les phénomènes naturels comme les multiples résultats possibles d'une loi naturelle relativement simple.

En d’autres termes, le mot régression semble suggérer que les données ne sont que l’effet visible et tangible d’un "modèle statistique". En d’autres termes, le modèle vient en premier, et vous souhaitez utiliser les données "pour revenir" à leur origine.


0

Comme je le sais, le mot « regressionsens statistique» désigne la mesure de la relation entre la valeur moyenne d’une variable et les valeurs correspondantes d’autres variables.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.