La population est l'ensemble (hypothétique) de toutes les personnes qui risquent de contracter la maladie; généralement, il s'agit de toutes les personnes (ou d'un sous-groupe de personnes clairement identifiables) résidant dans la zone d'étude. Il est important de définir clairement cette population, car elle est la cible de l'étude et de toutes les inférences faites à partir des données.
Lorsque les cas de la maladie sont indépendants (ce qui pourrait être une hypothèse raisonnable lorsque la maladie n'est pas facilement communiquée entre les personnes et n'est pas causée par les conditions environnementales locales) et qu'ils sont rares, les dénombrements doivent suivre de près une distribution de Poisson . Pour cette distribution, une bonne estimation de son écart-type est la racine carrée du dénombrement .
( 180 , 90 , 45 , 210 )( 13,4 , 9,5 , 6,7 , 14,5 )événement, le nombre réel de maladies observées au cours d'une saison variera par rapport à ce taux réel. La racine carrée du taux réel (mais inconnu!) Quantifie la quantité de variation susceptible de se produire. Étant donné que les dénombrements observés devraient être proches des taux réels, leurs racines carrées devraient être des substituts raisonnables des racines carrées des taux réels. Ces procurations sont exactement ce que l'on entend par «erreur standard».
1657714,577
9( 20 , 10 , 5 , 23 )( 4.5 , 3.2 , 2.2 , 4.8 ). Multipliant par9 convertir des grappes en personnes donne ( 40 , 28,5 , 20 , 44 ). Remarquez à quel point ces valeurs sont plus grandes qu'auparavant: le clustering augmente l'erreur relative.
C'est à peu près aussi loin que l'on peut aller avec ces données limitées. Ces calculs simples ont révélé que:
Il est essentiel de caractériser la population,
La racine carrée d'un compte est un point de départ approximatif pour évaluer son erreur standard,
La racine carrée doit être multipliée (approximativement) par un facteur pour refléter le manque d'indépendance des cas de maladie (et ce facteur peut être approximativement lié à la taille des grappes de maladies),
La variation entre ces dénombrements reflète principalement la variation du taux de maladie dans le temps plutôt que l'incertitude (concernant l'intensité de Poisson sous-jacente).