J'ai une série chronologique de données avec N = 14 comptes à chaque point dans le temps, et je veux calculer le coefficient de Gini et une erreur standard pour cette estimation à chaque point dans le temps.
Comme je n'ai que N = 14 comptes à chaque instant, j'ai procédé au calcul de la variance jackknife, c'est-à-dire de l'équation 7 de Tomson Ogwang«Une méthode pratique pour calculer l'indice de Gini et son« erreur standard ». OùG(n,k)est le coefficient de Gini des valeurs N sans élémentket ˉ G (x)est la moyenne deG(n,k).
Mise en œuvre naïve directe de la formule ci-dessus pour la variance.
calc.Gini.variance <- function(x) {
N <- length(x)
# using jacknifing as suggested by Tomson Ogwang - equation 7
# in the Oxford Bulletin of Economics and Statistics, 62, 1 (2000)
# ((n-1)/n) \times \sum_{k=1}^n (G(n,k)-\bar{G}(n))^2
gini.bar <- Gini(x)
gini.tmp <- vector(mode='numeric', length=N)
for (k in 1:N) {
gini.tmp[k] <- Gini(x[-k])
}
gini.bar <- mean(gini.tmp)
sum((gini.tmp-gini.bar)^2)*(N-1)/N
}
calc.Gini.variance(c(1,2,2,3,4,99))
# [1] 0.1696173
Gini(c(1,2,2,3,4,99))
# [1] 0.7462462
Est-ce une approche raisonnable pour un petit N? D'autres suggestions?