Les mathématiques du calcul de la confiance et des bandes de prédiction des courbes ajustées par régression non linéaire sont expliquées dans cette page de validation croisée. Cela montre que les bandes ne sont pas toujours / généralement symétriques.
Et voici une explication avec plus de mots et moins de mathématiques:
Tout d'abord, définissons G | x, qui est le gradient des paramètres à une valeur particulière de X et en utilisant toutes les valeurs les mieux ajustées des paramètres. Le résultat est un vecteur, avec un élément par paramètre. Pour chaque paramètre, il est défini comme dY / dP, où Y est la valeur Y de la courbe compte tenu de la valeur particulière de X et de toutes les valeurs de paramètre les mieux adaptées, et P est l'un des paramètres.)
G '| x est ce vecteur de gradient transposé, c'est donc une colonne plutôt qu'une ligne de valeurs. Cov est la matrice de covariance (Hesse inversée de la dernière itération). Il s'agit d'une matrice carrée avec un nombre de lignes et de colonnes égal au nombre de paramètres. Chaque élément de la matrice est la covariance entre deux paramètres. Nous utilisons Cov pour faire référence à la matrice de covariance normalisée , où chaque valeur est comprise entre -1 et 1.
Maintenant, calculez
c = G '| x * Cov * G | x.
Le résultat est un nombre unique pour toute valeur de X.
Les bandes de confiance et de prédiction sont centrées sur la courbe de meilleur ajustement et s'étendent au-dessus et au-dessous de la courbe d'une quantité égale.
Les bandes de confiance s'étendent au-dessus et au-dessous de la courbe:
= sqrt (c) * sqrt (SS / DF) * CriticalT (% de confiance, DF)
Les bandes de prédiction s'étendent sur une distance supplémentaire au-dessus et en dessous de la courbe, égale à:
= sqrt (c + 1) * sqrt (SS / DF) * CriticalT (% de confiance, DF)
Dans ces deux équations, la valeur de c (définie ci-dessus) dépend de la valeur de X, de sorte que les bandes de confiance et de prédiction ne sont pas à une distance constante de la courbe. La valeur de SS est la somme des carrés de l'ajustement et DF est le nombre de degrés de liberté (nombre de points de données moins nombre de paramètres). CriticalT est une constante de la distribution t basée sur le niveau de confiance souhaité (traditionnellement 95%) et le nombre de degrés de liberté. Pour des limites de 95% et un df assez grand, cette valeur est proche de 1,96. Si DF est petit, cette valeur est plus élevée.