Ratio standard des cookies sur les «visiteurs»?


31

Comme indiqué dans un récent article de blog , nous constatons une grande différence entre les "visiteurs" de Google Analytics et les "visiteurs" de Quantcast.

De plus, pour des raisons que nous n'avons jamais comprises, Google Analytics obtient simplement des chiffres plus importants que Quantcast. À l'heure actuelle, GA affiche plus de visiteurs (15 millions) sur stackoverflow.com seulement que Quantcast n'en voit sur l'ensemble du réseau (14 millions):

Pourquoi? Je ne sais pas. Soit Google Analytics perd parfois des cookies, soit Quantcast manque de visiteurs. Le comptage est une science inexacte.

Nous pensons que cela est dû au fait que Quantcast utilise un ratio plus conservateur de cookies par visiteur . Alors que Google Analytics peut considérer chaque cookie comme un "visiteur", Quantcast ne considérera que chaque cookie 1.24 comme un "visiteur". Cela me semble logique, car les gens peuvent accéder à nos sites à partir de plusieurs ordinateurs, de plusieurs navigateurs, etc.

J'ai deux questions étroitement liées:

  1. Existe-t-il un ratio standard accepté de cookies par visiteur? Il s'agit évidemment d'une science inexacte, mais y a-t-il une règle empirique émergente?

  2. Existe-t-il un moyen plus précis de compter les "visiteurs" d'un site Web que de se fier aux cookies du navigateur? Ou est-ce que ça va toujours être une sorte de crapshoot d'estimation au mieux, peu importe comment vous le mesurez?


Quantcast utilise définitivement les cookies, non? Ils ne vont pas simplement sur l'adresse IP ou quelque chose?
DisgruntledGoat

@disgruntledgoat je viens de consulter le site Web: "Quantcast fournit des données d'audience pour le nombre de cookies uniques et les personnes."
Matthew Brookes

@DisgruntledGoat consultez cette page. Il contient des cookies quantserve.com.
Yahel

Réponses:


14

Quantcast m'a envoyé un e-mail:

Vous avez mentionné qu'il y avait un delta assez important entre vos numéros GA et vos numéros QC. Bien que cela n'arrive pas souvent, cela arrive et il y a plusieurs raisons pour lesquelles cela peut se produire. Par exemple, nous tenons compte des cookies tiers et des actualisations automatiques et GA ne le fait pas. Nous demandons également aux éditeurs de placer notre tag en bas de la page pour se conformer aux normes MRC et IAB. Si vos autres balises de mesure sont plus hautes sur la page, elles pourraient se déclencher lorsque Quantcast ne le fait pas. (Nous sommes le seul service de mesure du trafic accrédité MRC). De plus, les nombres ne seront jamais exactement les mêmes en raison de considérations de fuseau horaire - nous utilisons une fonction de normalisation et les GA sont fixes.

Si vous souhaitez en savoir plus sur la façon dont nous déterminons nos numéros, veuillez consulter: http://www.quantcast.com/how-we-do-it . Nous avons également des livres blancs sur nos données d'audience corrigées des cookies et notre méthodologie ici.

En parcourant les livres blancs, je vois qu'ils font, en fait, ce que Jeff suggère: truquer les chiffres "officiels" pour obtenir quelque chose qu'ils pensent être plus proche du vrai nombre de personnes. Ils ont un livre blanc sur l'audience corrigée des cookies (lien PDF) qui implique que leur système est plutôt élaboré, pas aussi simple que de simplement le diviser par un nombre magique:

Le programme Quantcast Quantified Publisher capture plus de 75 milliards d'événements de consommation de médias chaque mois, générés par plus de 1,4 milliard de cookies (données en juin 2008). De plus, beaucoup de nos partenaires Quantified Publisher partagent avec nous des identifiants anonymes qui sont indépendants des cookies. Notre modèle comprend également plusieurs panneaux qui fournissent des points de référence basés sur les personnes et un étalonnage sans suppression de cookies. Nous triangulons cette masse de données avec différents processus de collecte, biais et problèmes. Nos modèles tiennent compte de la fréquence des visites, des périodes, de la probabilité d'utilisation de plusieurs ordinateurs et même de l'impact de plusieurs personnes utilisant le même ordinateur pour fournir des estimations basées sur les personnes. Notre modèle de traduction de cookies uniques vers des personnes a été validé à l'aide d'échantillons d'exclusion et d'ensembles de données indépendants. De plus, notre modèle est dynamique et recalibré sur une base continue pour refléter la nature évolutive des modèles de trafic Internet.


2
Intéressant. Ce dernier extrait est plus informatif (et convaincant) que le premier. GA n'a pas besoin de tenir compte des cookies tiers, car il utilise des cookies propriétaires. Oui, les différences de fuseau horaire modifieront les nombres précis, mais sur des périodes d'un mois, il est extrêmement peu probable qu'elles expliquent des différences de mesure importantes.
Yahel

27

Il y a un autre facteur en jeu avec le sous-comptage Quantcast: ils utilisent des cookies tiers (cookies servis depuis le .quantserve.comdomaine), tandis que Google Analytics utilise des cookies propriétaires ( stackexchange.com, etc.)

Ceci est assez crucial, car certains navigateurs (en particulier Safari, mais plus récemment Firefox et Chrome) désactivent les cookies tiers comme paramètre par défaut, et de nombreux autres peuvent choisir individuellement des paramètres de confidentialité qui interdisent les cookies tiers. Cela signifie qu'il existe un sous-ensemble de la population qui ne sera jamais suivi par les cookies de QuantCast. En soi, cela signifie que Google Analytics renverra toujours un nombre de visiteurs plus élevé.

Je dirais qu'il n'y a pas de règle d'or. En tant que praticien de l'analyse, je dirais que la quête d'un «vrai» nombre de visiteurs est sans espoir, et se concentre plutôt sur les visites elles-mêmes. Par exemple, pour votre compte Google Analytics, je suis au moins 8 visiteurs différents, ayant accédé à StackOverflow depuis Chrome, Safari et Firefox sur mon ordinateur portable de travail, mon ordinateur portable personnel, mon téléphone et mon iPad. Les services d'analyse comptent tous de différentes manières, et retournent donc tous des nombres sensiblement différents.

Même avec une implémentation parfaite, Google Analytics affichera presque toujours un nombre de visites inférieur à un système d'analyse basé sur les journaux du serveur, mais affichera un nombre de visites plus élevé qu'un système basé sur des cookies tiers comme Quantcast. L'important n'est pas de regarder les totaux bruts, mais les tendances que chaque méthode montre dans ses points forts. Donc, ne comparez jamais les numéros Quantcast aux numéros Google Analytics; utilisez plutôt les nombres dans les contextes dans lesquels ils ont été collectés.

Un autre problème pourrait être que votre implémentation de Google Analytics n'est pas correcte, car la configurer pour votre type de configuration à plusieurs domaines et sous-domaines peut être un cauchemar si elle n'est pas effectuée correctement et rigoureusement, ce qui pourrait conduire à un seul navigateur compté comme plusieurs visiteurs, ce qui gonfle votre compte. Ce n'est jamais un problème pour Quantcast, car tous les cookies sont définis sur leur domaine tiers.


Google Chrome semble également bloquer les cookies tiers par défaut.
MrWhite

7

Le rapport cookies / visiteurs uniques est généralement compris entre 1,3 et 1,7 pour les sites avec plus d'un million de visites.

Bien que yc01 ait raison de dire que GA utilise des cookies propriétaires par rapport à des cookies tiers, RealSelf.com utilise deux fournisseurs d'analyse propriétaires (GA et Comscore Direct) et GA affiche toujours 30% de visiteurs uniques absolus de plus que les visiteurs uniques de Comscore.

Comscore n'affiche que des visiteurs uniques par pays, donc pour comparer GA à Comscore, nous devons calculer le nombre de visiteurs uniques absolus basés aux États-Unis comme suit:

Visites aux États-Unis / Visites mondiales * Utilisateurs uniques absolus

(1 150 110/1 650 979) * 1 273 059 = 886 842 Utilisateurs uniques basés aux États-Unis

En revanche, Comscore rapporte 680 900 utilisateurs uniques basés aux États-Unis. GA montre donc 30,2% de plus.

Comscore a bâti son entreprise en essayant d'être précis, tandis que GA est principalement un moyen gratuit de suivre et d'optimiser les sites qui utilisent AdWords et AdSense. Comscore dispose d'un panel de personnes qu'ils utilisent également pour estimer le trafic, et ils utilisent ce panel pour déterminer un nombre moyen de cookies par personne. Avec plus de personnes utilisant des appareils mobiles (notre utilisation mobile est de 15%), il est logique que les cookies uniques surestiment le nombre de personnes uniques.


"Le rapport entre les cookies et les visiteurs uniques se situe généralement entre 1,3 et 1,7 pour les sites avec plus d'un million de visites." Est-ce un chiffre publié par Comscore?
Ciaran

c'est étonnamment précis pour nous; J'ai exécuté les UserSessionstatistiques de la table sur quelques sites et elles varient de 2,0 (débordement de pile) à 1,46 (webapps.se) avec tout le reste entre les deux. 1.6 semble être un défaut très sensé pour les sites axés sur la technologie.
Jeff Atwood

4

Voici une étude récente (4 mai 2011 - hier quand j'écris ceci) de MediaMind avec "Cookie Inflation Multipliers" pour différents marchés:

Leur facteur d'inflation calculé se situe entre 2,2 pour l'Allemagne et 3,0 pour les États-Unis.


c'est excellent - exactement le genre de référence que je cherchais
Jeff Atwood

2

Peut-être que votre nombre de visiteurs GA est plus gonflé qu'un site normal en raison de la nature plus technique de son audience? Par exemple, les programmeurs, les développeurs Web en particulier, sont plus susceptibles d'utiliser une gamme de navigateurs et d'augmenter ainsi le nombre de cookies.

Pour la question 1, je suppose que, comme avec de nombreuses mesures, il est préférable d'utiliser les données de votre propre site au lieu de rechercher des normes mondiales car les agrégats peuvent être trompeurs. Une façon d'obtenir un cookie pour le nombre réel de visiteurs pourrait être de compter le nombre de cookies que vous voyez de chaque utilisateur enregistré, puis d'en déduire le nombre.

Quant au numéro 2, théoriquement la meilleure façon de compter les vrais visiteurs serait de forcer tout le monde à ouvrir un compte. Comme ce n'est évidemment pas une bonne idée, vous pouvez envisager la normalisation. Par exemple, vous pouvez utiliser les cookies moyens pour les statistiques d'utilisateurs enregistrés que j'ai suggérées ci-dessus et les appliquer aux nombres de visiteurs que GA rapporte.


Ceci est un excellent point. Sur Stack Overflow, nous avons actuellement 531 484 sessions, dont 261 547 pointent vers des utilisateurs uniques - donc essentiellement 2 cookies pour 1 utilisateur.
Jeff Atwood

-1

Je pense que IP est capable de confiance ... quand je crée un système statistique comme GA avec python j'utilise une méthode comme celle-ci

  • envoyer un cookie au navigateur et récupérer toutes les données de l'agent dans la base de données
  • moyen facile si une nouvelle visite contient un cookie, ce n'est pas une nouvelle visite, je l'enregistre donc comme une nouvelle visite (j'ai également attribué une date et un délai pour trouver une nouvelle visite si l'utilisateur répète le site après 2 heures)
  • enregistrer l'IP de l'utilisateur et un identifiant pour cet utilisateur et l'IP et le cookie (son enregistrement dans le cookie également)
  • un nouvel utilisateur vient et n'a pas de cookie ... cette adresse IP est-elle nouvelle? Oui? OK son nouvel utilisateur ne saisit que l'agent utilisateur et IP / non? combien de fois cet utilisateur vient? plus que limite? pas vraiment une nouvelle visite, pas plus avec cet agent utilisateur? OK c'est nouveau ...: D

cette méthode a un défaut mais pas mauvais et des données presque valides ... (cela dépend aussi du temps de retard pour trouver un nouvel utilisateur (délai entre 2 visites) et essayer du temps pour les utilisateurs n'ayant pas de cookie)


5
Comment cela gérerait-il par exemple une entreprise avec de nombreux développeurs différents accédant à StackOverflow depuis un NAT? Seraient-ils tous comptés comme un seul visiteur?
Svish

3
L'aspect IP de cela est vraiment imparfait. L'adresse IP n'est pas un identifiant unique.
Yahel

il y a du temps pour cela ... nous vérifions l'agent et d'autres choses et nous pouvons ajouter une ip plus de 100 fois ... sa façon suggérée de trouver un utilisateur réel derrière un NAT
Mohammad Efazati
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.