Bonne question. Rappelons d'abord d'où vient cette approximation . Soit vos points de données, votre modèle et les paramètres de votre modèle. Alors la fonction objective du problème des moindres carrés non linéaires est où est le vecteur des résidus, . La exacte de la fonction objectif est . Donc, l'erreur dans cette approximation est( x i , y i ) f ( ⋅ ) β 1H≈JTJ(xi,yi)f(⋅)βrri=yi-f(xi,β)H=JTJ+∑ri∇2riH-JTJ=∑ri∇2ri12rTrrrje= yje- f( xje, β)H= JTJ+ ∑ rje∇2rjeH- JTJ= ∑ rje∇2rje. C'est une bonne approximation lorsque les résidus eux-mêmes sont petits; ou lorsque la dérivée 2e des résidus est petite. Les moindres carrés linéaires peuvent être considérés comme un cas spécial où la dérivée seconde des résidus est nulle.
Quant à l'approximation des différences finies, elle est relativement bon marché. Pour calculer une différence centrale, vous aurez besoin d'évaluer la jacobienne un montant supplémentaire fois (une différence avant vous coûtera évaluations supplémentaires, donc je ne voudrais pas déranger). L'erreur de l'approximation de la différence centrale est proportionnelle à et , où est la taille du pas. La taille de pas optimale est , où2 nn∇4rh2h ∼ ϵ 1h ϵh ∼ ϵ13ϵest la précision de la machine. Donc, à moins que les dérivées des résidus explosent, il est assez clair que l'approximation des différences finies devrait être beaucoup mieux. Je dois souligner que, si le calcul est minimal, la comptabilité n'est pas anodine. Chaque différence finie sur le jacobien vous donnera une ligne de la toile de jute pour chaque résidu. Vous devrez ensuite remonter le Hessian en utilisant la formule ci-dessus.
Il existe cependant une troisième option. Si votre solveur utilise une méthode Quasi-Newton (DFP, BFGS, Bryoden, etc.), il se rapproche déjà de la Hesse à chaque itération. L'approximation peut être assez bonne, car elle utilise la fonction objectif et les valeurs de gradient de chaque itération. La plupart des solveurs vous donneront accès à l'estimation finale de Hesse (ou son inverse). Si c'est une option pour vous, je l'utiliserais comme estimation de la Hesse. Il est déjà calculé et ce sera probablement une assez bonne estimation.