Résumé en cinq points
oui, l’idée est de donner un bref résumé de la distribution. Il devrait être à peu près symétrique par rapport à la moyenne, la médiane devrait être proche de 0, les valeurs 1Q et 3Q devraient idéalement être des valeurs approximativement similaires.
Coefficients etβi^s
Chaque coefficient du modèle est une variable aléatoire gaussienne (normale). Le est l'estimation de la moyenne de la distribution de cette variable aléatoire et l'erreur type est la racine carrée de la variance de cette distribution. C'est une mesure de l'incertitude dans l'estimation de .βi^βi^
Vous pouvez regarder comment ceux-ci sont calculés (ainsi que les formules mathématiques utilisées) sur Wikipedia . Notez que tout programme de statistiques qui se respecte ne se servira pas des équations mathématiques standard pour calculer le car leur sur un ordinateur peut entraîner une perte de précision importante dans les calculs.βi^
t -statistiques
Les statistiques sont les estimations ( ) divisées par leurs erreurs types ( ), par exemple . En supposant que vous ayez le même modèle en objet que votre Q:tβi^σi^ti=βi^σi^mod
> mod <- lm(Sepal.Width ~ Petal.Width, data = iris)
alors les rapports valeurs sont calculés comme suit:t
> tstats <- coef(mod) / sqrt(diag(vcov(mod)))
(Intercept) Petal.Width
53.277950 -4.786461
Où coef(mod)
sont les et donne les racines carrées des éléments diagonaux de la matrice de covariance des paramètres du modèle, qui sont les erreurs types des paramètres ( ).βi^sqrt(diag(vcov(mod)))
σi^
La valeur p est la probabilité d'atteindre aégale ou supérieure à la valeur t absolue observée si l'hypothèse nulle ( ) était vraie, où est . Ils sont calculés comme (en utilisant d'en haut):|t|H0H0βi=0tstats
> 2 * pt(abs(tstats), df = df.residual(mod), lower.tail = FALSE)
(Intercept) Petal.Width
1.835999e-98 4.073229e-06
Nous calculons donc la probabilité d'extrémité supérieure pour obtenir les valeurs nous avons obtenues à partir d'une distribution avec des degrés de liberté égaux aux degrés de liberté résiduels du modèle. Cela représente la probabilité d'obtenir une valeur supérieure aux valeurs absolues des observées . Il est multiplié par 2, car bien sûr, peut également être grand dans le sens négatif.ttttt
Erreur standard résiduelle
L'erreur standard résiduelle est une estimation du paramètre . L'hypothèse des moindres carrés ordinaires est que les résidus sont décrits individuellement par une distribution gaussienne (normale) avec une moyenne 0 et un écart type . Le rapporte à l'hypothèse de la variance constante; chaque résidu a la même variance et cette variance est égale à .σσσσ2
ajustéR2
ajusté est calculé comme suit:R2
1−(1−R2)n−1n−p−1
Le ajusté est la même chose que le , mais ajusté pour la complexité (c'est-à-dire le nombre de paramètres) du modèle. Étant donné un modèle avec un seul paramètre, avec un certain , si on ajoute un autre paramètre à ce modèle, le du nouveau modèle doit augmenter, même si le paramètre ajouté n'a pas de puissance statistique. Le ajusté en tient compte en incluant le nombre de paramètres dans le modèle.R2R2R2R2R2
F statistique
Le est le rapport de deux variances ( ), la variance expliquée par les paramètres du modèle (somme des carrés de régression, SSR) et la variance résiduelle ou non expliquée (somme des carrés d'erreur, SSE). Vous pouvez mieux voir cela si nous obtenons la table ANOVA du modèle via :FSSR/SSEanova()
> anova(mod)
Analysis of Variance Table
Response: Sepal.Width
Df Sum Sq Mean Sq F value Pr(>F)
Petal.Width 1 3.7945 3.7945 22.91 4.073e-06 ***
Residuals 148 24.5124 0.1656
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Les s sont les mêmes dans la sortie ANOVA et dans la sortie. La colonne contient les deux variances et . Nous pouvons calculer la probabilité d'obtenir un si grand sous l'hypothèse nulle d'absence d'effet, à partir d'une distribution avec 1 et 148 degrés de liberté. C'est ce qui est rapporté dans la dernière colonne du tableau ANOVA. Dans le cas simple d’un prédicteur continu unique (selon votre exemple), , c’est pourquoi les valeurs p sont identiques. Cette équivalence n'est valable que dans ce cas simple.F3,7945 / 0,1666 = 22,91 F F F = t 2 P e t a l . W i d t hsummary(mod)
Mean Sq
3.7945/0.1656=22.91FFF=t2Petal.Width