Avec un raisonnement similaire à celui- ci , je pourrai peut-être répondre à votre question sous certaines conditions.
Soit votre vraie valeur pour le point de données et la valeur estimée. Si nous supposons que les différences entre les valeurs estimées et vraies ont i t h x ixiithx^i
signifie zéro (c'est-à-dire que les sont répartis autour de )xix^ixi
suivre une distribution normale
et tous ont le même écart-typeσ
en bref:
x^i−xi∼N(0,σ2),
alors vous voulez vraiment un intervalle de confiance pour .σ
Si les hypothèses ci-dessus sont vraies
suit une distribution avec (pas ) degrés de liberté. Ça signifie χ 2 n nn-1
nRMSE2σ2=n1n∑i(xi^−xi)2σ2
χ2nnn−1
P(χ2α2,n≤nRMSE2σ2≤χ21−α2,n)=1−α⇔P⎛⎝nRMSE2χ21−α2,n≤σ2≤nRMSE2χ2α2,n⎞⎠=1−α⇔P⎛⎝⎜nχ21−α2,n−−−−−−√RMSE≤σ≤nχ2α2,n−−−−−√RMSE⎞⎠⎟=1−α.
Par conséquent,
est votre intervalle de confiance.
⎡⎣⎢nχ21−α2,n−−−−−−√RMSE,nχ2α2,n−−−−−√RMSE⎤⎦⎥
Voici un programme python qui simule votre situation
from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
y[i] =sqrt( mean((random.randn(n)*s)**2))
print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)
J'espère que cela pourra aider.
Si vous ne savez pas si les hypothèses s'appliquent ou si vous voulez comparer ce que j'ai écrit à une autre méthode, vous pouvez toujours essayer le bootstrap .