Cet article fait référence à un modèle de régression linéaire bivariée, . J'ai toujours pris la partition de la somme totale des carrés (SSTO) en somme des carrés pour l'erreur (SSE) et somme des carrés pour le modèle (SSR) sur la foi, mais une fois que j'ai vraiment commencé à y penser, je ne comprends pas pourquoi ça marche ...
La partie que je ne comprends:
: une valeur observée de y
yi : La moyenne de tous les s observés
: La valeur ajustée / prédite de y pour une observation donnée x
: résiduel / erreur (si carré et additionné pour toutes les observations, c'est SSE)
: dans quelle mesure la valeur ajustée du modèle diffère de la moyenne (si elle est au carré et additionnée pour toutes les observations, c'est SSR)
: Dans quelle mesure une valeur observée diffère de la moyenne (si elle est calculée et additionnée pour toutes les observations, il s'agit de SSTO).
Je peux comprendre pourquoi, pour une seule observation, sans quadrature, . Et je peux comprendre pourquoi, si vous voulez additionner des choses à toutes les observations, vous devez les cadrer ou elles totaliseront 0.
La partie que je ne comprends pas est pourquoi (par exemple. SSTO = SSR + SSE). Il semble que si vous avez une situation où , alors , pas . Pourquoi n'est-ce pas le cas ici? A = B + C A 2 = B 2 + 2 B C + C 2 A 2 = B 2 + C 2