Existe-t-il un biais connu dans les sondages téléphoniques aux États-Unis?
Oui, il existe un biais connu dans les sondages téléphoniques aux États-Unis: les téléphones portables.
Pendant longtemps, l'étalon-or des sondages téléphoniques aléatoires aux États-Unis était la numérotation aléatoire: les machines généraient des numéros de téléphone aléatoires et les sondeurs posaient des questions à quiconque décrochait. En supposant que tout le monde avait un et un seul téléphone, le sondage était un simple échantillon aléatoire de propriétaires de téléphones.
Cependant, l'arrivée des téléphones portables a changé cela: de nombreuses personnes, en particulier les jeunes, n'ont pas de ligne fixe. Même au sein de données démographiques spécifiques (tranche d'âge, sexe, race), ces populations utilisant uniquement des téléphones portables ont des attitudes politiques distinctes des populations disposant de lignes fixes ou des deux types de téléphones. Puisqu'il est illégal pour les numéroteurs automatisés d'appeler des téléphones portables, cela fait des ravages avec les sondages.
Pour les sondeurs, cela signifie qu'ils doivent utiliser des êtres humains pour appeler tous les téléphones portables, ce qui est évidemment beaucoup plus cher. Les sondeurs doivent donc, a priori , décider du nombre de téléphones portables dont ils ont besoin pour contrôler les coûts. Le nombre d'appels par téléphone portable doit être mis en balance avec le nombre d'appels fixes par téléphone d'une manière scientifiquement valable - en composant suffisamment de maisons réservées aux téléphones portables, de maisons fixes uniquement et de maisons avec les deux proportionnellement à leur incidence dans la population, tout en n'étant pas dépassant leur budget!
L'effet des téléphones portables n'est probablement pas la source de biais potentiels.
Je soupçonne que les sondeurs que le sondage Washington Times / ABC a utilisés sont bien conscients de tout cela, car comment construire un échantillon aléatoire à la lumière de "l'effet de téléphone portable", c'est à peu près le sujet que tous les sondages politiques contemporains traitent aujourd'hui. Il est donc probable que les sondeurs aient pris des mesures pour atténuer «l'effet de téléphone portable» dans ce sondage. Cependant, les sondeurs ont peut-être eu une mauvaise journée et leur composition aléatoire de numéros de téléphone portable n'a pas donné suffisamment de réponses réelles.
S'il y a un biais, ce pourrait être les poids de l'échantillon.
Une autre source potentielle de biais dans ces sondages est la pondération de l'échantillon. Le but de la pondération des échantillons est de réduire le nombre de personnes que vous devez atteindre dans divers (combinaisons de) groupes démographiques en attribuant des poids différents à différents segments de la population. Ceci, bien sûr, conduit à la question "comment savez-vous que vous avez correctement pondéré l'échantillon?" C'est pourquoi certaines entreprises de sondage auront des estimations qui sont constamment supérieures / inférieures à celles d'autres entreprises de sondage: elles ont différentes méthodes pour pondérer leur échantillon, et cela tire systématiquement le résultat dans une direction particulière.
Ceci est un exemple de compromis biais-variance. Les sondeurs pourraient utiliser un petit échantillon aléatoire simple pour obtenir une estimation de variance élevée. Ou ils pourraient utiliser des poids pour réduire la variance de l'estimation à partir du petit échantillon, mais au prix d'un biais (statistique).
Les enquêteurs (et les statisticiens en général) doivent tous faire face au compromis biais-variance d'une manière ou d'une autre. Cela ne signifie pas nécessairement qu'ils sont malveillants ou tentent de manipuler le public.
Les explications alternatives abondent.
Il existe de nombreuses façons de gâcher un sondage, accidentellement ou délibérément. Reformuler une question peut donner des réponses différentes selon les groupes. Les sondages poussés, dans lesquels les questions sont formulées pour obtenir une réponse particulière, en sont l'exemple le plus évident et le plus néfaste.
Une organisation intéressée à manipuler l'opinion publique choisirait-elle un sondage téléphonique, un sondage en ligne ou une interview dans la rue, si elle recherchait un parti pris spécifique?
Cette question n'est pas entièrement statistique, car elle appelle à la spéculation sur les motifs et les méthodes d'une entité hypothétique et malveillante. Je ne peux y répondre que partiellement.
Les entretiens avec les gens dans la rue ne sont pas vraiment aléatoires et sont probablement biaisés (dans le sens où ils auront tendance à inclure certains groupes à une proportion plus élevée que d'autres).
Le but de la numérotation aléatoire est d'atteindre un état où tout le monde a une probabilité de sélection égale. Aller à un coin de rue et interviewer des gens n'atteint pas tout à fait cela, car vous aurez tendance à inclure des personnes qui vivent et travaillent à proximité. Si vous allez dans une rue de Washington, DC, vous aurez presque 0 chance de sélectionner une personne qui n'est pas de DC, du Maryland ou de Virginie.
De plus, pensez à quelle rue vous allez. Interroger des gens dans la rue, disons, dans le quartier de Cleveland Park à Washington, DC sera très différent de l'interview des gens dans la rue à Anacostia: ces endroits ont une composition démographique très distincte.
Les sondages en ligne ne sont pas vraiment aléatoires, mais il est difficile de savoir si c'est pire que les sondages téléphoniques.
La population de personnes optant pour un sondage en ligne est une population autosélectionnée, pas nécessairement échantillonnée au hasard parmi tous les répondants potentiels. Les sondeurs traditionnels qui ont tendance à favoriser les sondages téléphoniques sont très sceptiques à l'égard des sondages en ligne pour cette raison. Cependant, des gens comme Andrew Gelman sont moins certains que le résultat final d'un sondage téléphonique composé au hasard et d'un sondage en ligne auto-sélectionné est significativement différent. C'est vraiment un domaine de recherche ouvert.