Dans l'échantillonnage d'enquête, l'erreur-type de l'estimation de la proportion est nécessaire. Cela dépend plus de i que de j. Il faut également que les bulletins de vote ouverts soient sélectionnés au hasard. Si p est la vraie proportion finale pour le candidat A, alors la variance de l'estimation est
(1−ij)p(1−p)i
(1−ij)est appelé le facteur de correction de la population finie. Pour estimer cette variance, l'estimation habituelle de p est substituée à p dans la formule. L'erreur standard est obtenue en prenant la racine carrée. Pour prédire un gagnant, le sondeur peut utiliser l'estimation plus ou moins 3 erreurs types. Si 0,5 n'est pas contenu dans l'intervalle, le candidat A est déclaré vainqueur si 0,5 est inférieur à la limite inférieure, ou son adversaire est déclaré vainqueur si 0,5 est supérieur à la limite supérieure. Bien sûr, cela ne dit qu'avec une très grande confiance qui sera le vainqueur dans le cas où 0,5 est en dehors de l'intervalle. Le niveau de confiance est de 0,99 si vous utilisez trois erreurs standard (basées sur l'approximation normale du binôme). Si 0,5 est dans l'intervalle, personne n'est déclaré vainqueur et le sondeur attend que plus de données s'accumulent.
En faisant une projection, les sondeurs peuvent sélectionner un échantillon aléatoire stratifié parmi les votes accumulés pour éviter tout biais potentiel qui pourrait se produire si l'on regarde tous les bulletins de vote comptés. Le problème avec l'examen de tous les votes accumulés est que certaines circonscriptions finissent par compter sur les autres et qu'elles peuvent ne pas être représentatives de la population.
L'article ici fournit une bonne couverture du problème et de nombreuses références.
Il a été souligné que les votes accumulés peuvent fournir des estimations biaisées des proportions, car soit les circonscriptions qui n'ont pas encore été déclarées sont des circonscriptions qui ont tendance à favoriser le parti avec le candidat en fuite, soit les bulletins de vote par correspondance sont susceptibles de favoriser le candidat en fuite. et ces votes sont comptés en dernier. Les sondeurs sophistiqués comme Harris et Gallup ne tombent pas dans de tels pièges. La simple analyse de la construction d'intervalles de confiance basée sur les votes accumulés que j'ai décrite n'est qu'un des facteurs utilisés. Ces sondeurs ont beaucoup plus d'informations à leur disposition. Ils ont des sondages qui ont été effectués peu de temps avant les élections et ils ont les schémas de vote de tous les bureaux de vote et des votes des absents lors des élections des dernières années.
Donc, s'il y a des biais clairs qui pourraient faire basculer une élection serrée dans la direction opposée, les sondeurs le reconnaîtront et retarderont la projection d'un gagnant.
Aux États-Unis, les bulletins de vote par correspondance proviennent principalement des militaires à l'étranger et des étudiants qui sont à l'école loin de chez eux. Alors que les militaires ont tendance à être plus conservateurs et à voter pour les républicains, les collègues étudiants ont tendance à être plus libéraux et à voter démocrates. Toutes ces considérations sont prises en compte.
Le soin et la sophistication des sondages modernes sont la raison pour laquelle des erreurs grossières telles que le sondage Literary Digest de 1936 ou la concession prématurée du journal de Chicago de l'élection de 1948 à Dewey ne se sont pas produites depuis lors.