J'essaie de tester l'adéquation d'un vecteur de données de comptage à un binôme. Pour ce faire, j'utilise la goodfit()fonction dans le vcdpackage. Cependant, lorsque j'exécute la fonction, elle renvoie NaNla valeur de p du test du chi carré. Dans ma configuration, j'ai un vecteur de données de comptage avec 75 éléments.
> library(vcd)
> counts <- c(32, 35, 44, 35, 41, 33, 42, 49, 36, 41, 42, 45, 38, 43, 36,
35, 40, 40, 43, 34, 39, 31, 40, 39, 36, 37, 37, 37, 32, 48, 41,
32, 37, 36, 49, 37, 41, 36, 34, 37, 41, 32, 36, 36, 30, 33, 33,
42, 39, 36, 36, 29, 31, 41, 36, 39, 40, 37, 39, 39, 31, 39, 37,
40, 33, 41, 34, 46, 35, 41, 44, 38, 44, 34, 42)
> test.gof <- goodfit(counts, type="binomial",
+ par=list(size=length(counts), prob=0.5))
Tout fonctionne bien, mais lorsque j'inspecte l' goodfit()objet, j'obtiens ce qui suit:
> summary(test.gof)
Goodness-of-fit test for binomial distribution
X^2 df P(> X^2)
Pearson NaN 75 NaN
Likelihood Ratio 21.48322 19 0.3107244
Warning message:
In summary.goodfit(test.gof) : Chi-squared approximation may be incorrect
Je soupçonnais que c'était un petit problème d'échantillon au début, mais j'ai également un ensemble de données avec 50 observations qui ne revient pas NaNpour la valeur de p. J'ai également essayé de basculer la méthode en goodfit()ML avec des résultats similaires.
Pourquoi cette fonction se produirait-elle NaNdans ce cas? Existe-t-il une fonction alternative pour calculer GOF sur les données de comptage?