Il existe un moyen très simple d'utiliser presque toutes les mesures de corrélation pour ajuster les régressions linéaires et qui reproduit les moindres carrés lorsque vous utilisez la corrélation de Pearson.
Considérons que si la pente d'une relation est , la corrélation entre y - β x et x devrait être de 0 .βy- βXX0
En effet, si c'était autre chose que , il y aurait une relation linéaire non capturée - c'est ce que la mesure de corrélation prendrait.0
On pourrait donc estimer la pente en trouvant la pente, qui fait que la corrélation d' échantillon entre y - ˜ β x et x soit 0 . Dans de nombreux cas - par exemple lors de l'utilisation de mesures basées sur le classement - la corrélation sera une fonction échelonnée de la valeur de l'estimation de la pente, il peut donc y avoir un intervalle où elle est nulle. Dans ce cas, nous définissons normalement l'estimation de l'échantillon comme étant le centre de l'intervalle. Souvent, la fonction pas à pas passe de supérieur à zéro à inférieur à zéro à un moment donné, et dans ce cas, l'estimation se situe au point de saut.β~y- β~XX0
Cette définition fonctionne, par exemple, avec toutes sortes de corrélations basées sur le classement et robustes. Il peut également être utilisé pour obtenir un intervalle pour la pente (de la manière habituelle - en trouvant les pentes qui marquent la frontière entre juste des corrélations significatives et juste des corrélations insignifiantes).
Cela ne définit bien sûr que la pente; une fois la pente estimée, l'ordonnée à l'origine peut être basée sur une estimation d'emplacement appropriée calculée sur les résidus . Avec les corrélations basées sur le rang, la médiane est un choix courant, mais il existe de nombreux autres choix appropriés.y- β~X
Voici la corrélation tracée par rapport à la pente des car
données dans R:
La corrélation de Pearson croise 0 à la pente des moindres carrés, 3,932
La corrélation de Kendall croise 0 à la pente Theil-Sen, 3,667
La corrélation de Spearman croise 0 donnant une pente "Spearman-line" de 3,714
Ce sont les trois estimations de pente pour notre exemple. Maintenant, nous avons besoin d'interceptions. Pour plus de simplicité, je vais simplement utiliser le résiduel moyen pour la première interception et la médiane pour les deux autres (cela n'a pas beaucoup d'importance dans ce cas):
intercept
Pearson: -17.573 *
Kendall: -15.667
Spearman: -16.285
* (la petite différence par rapport aux moindres carrés est due à une erreur d'arrondi dans l'estimation de la pente; il y a sans doute une erreur d'arrondi similaire dans les autres estimations)
Les lignes ajustées correspondantes (en utilisant le même schéma de couleurs que ci-dessus) sont:
Edit: Par comparaison, la pente de corrélation de quadrant est 3,333
Les pentes de corrélation de Kendall et de corrélation de Spearman sont sensiblement plus robustes aux valeurs aberrantes influentes que les moindres carrés. Voir ici pour un exemple dramatique dans le cas du Kendall.