Soit points de données , dans le plan, traçons une droite
. Si nous prédisons comme la valeur de , alors l' erreur est , l' erreur au carré est
, et l' erreur quadratique totale . Nous demandonsn(xi,yi),i=1,2,…ny=ax+baxi+by^iyi(yi−y^i)=(yi−axi−b)(yi−axi−b)2 ∑ni=1(yi−axi−b)2
Quel choix de et minimise
?abS=∑i=1n(yi−axi−b)2
Puisque est la distance verticale de partir de la droite, nous demandons la ligne telle que la somme des carrés des distances verticales des points à partir de la droite soit aussi petite que possible. Maintenant, est une fonction quadratique de et et atteint sa valeur minimale lorsque et sont tels que
À partir de la deuxième équation, nous obtenons
où
(yi−axi−b)(xi,yi)Sabab
∂S∂a∂S∂b=2∑i=1n(yi−axi−b)(−xi)=2∑i=1n(yi−axi−b)(−1)=0=0
b=1n∑i=1n(yi−axi)=μy−aμx
μy=1n∑i=1nyi, μx=1n∑i=1nxi are the arithmetic average values
of the
yi's and the
xi's respectively. Substituting into the
first equation, we get
a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x.
Thus, the line that minimizes
S can be expressed as
y=ax+b=μy+((1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x)(x−μx),
and the minimum value of
S is
Smin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1x2i)−μ2x.
If we interchange the roles of x and y, draw a line
x=a^y+b^, and ask for the values of
a^ and b^ that minimize
T=∑i=1n(xi−a^yi−b^)2,
that is, we want the line such that the
sum of the squares of the
horizontal distances of the points from
the line is as small as possible, then we get
x=a^y+b^=μx+((1n∑ni=1xiyi)−μxμy(1n∑ni=1y2i)−μ2y)(y−μy)
and the minimum value of
T is
Tmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1y2i)−μ2y.
Note that both lines pass through the point (μx,μy)
but the slopes are
a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x, a^−1=(1n∑ni=1y2i)−μ2y(1n∑ni=1xiyi)−μxμy
are different in general. Indeed, as @whuber points out in a comment, the
slopes are the same when all the points
(xi,yi) lie on the same
straight line. To see this, note that
a^−1−a=Smin(1n∑ni=1xiyi)−μxμy=0⇒Smin=0⇒yi=axi+b,i=1,2,…,n.