J'ai un ensemble de données contenant le nombre d'actions effectuées par des individus au cours de 7 jours. L'action spécifique ne devrait pas être pertinente pour cette question. Voici quelques statistiques descriptives pour l'ensemble de données:
Voici un histogramme des données:
À en juger par la source des données, j'ai pensé que cela conviendrait à une distribution de Poisson. Cependant, la variance moyenne ≠ et l'histogramme sont fortement pondérés à gauche. De plus, j'ai exécuté le goodfit
test dans R et obtenu:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
La méthode du maximum de vraisemblance a également produit une valeur de p = 0. En supposant que l'hypothèse nulle est: les données correspondent à une distribution de Poisson (la documentation ne le spécifie pas), puis le goodfit
test dit que nous devons rejeter l'hypothèse nulle, donc les données ne le font pas correspondre à une distribution de Poisson.
Cette analyse est-elle correcte? Si tel est le cas, quelle distribution, selon vous, correspondra à ces données?
Mon but ultime est de comparer le nombre moyen d'actions entre 2 échantillons pour voir si les moyennes sont différentes; la vérification de la distribution est-elle même nécessaire? Ma compréhension est que les tests typiques (tests z-, t-, ) ne fonctionnent pas pour les distributions de Poisson. Quel test dois-je utiliser si les données sont effectivement distribuées par Poisson?