Comment trouver les fautes d'orthographe courantes pour mon nom de domaine?


38

J'aimerais enregistrer des fautes d'orthographe pour mon nom de domaine, mais je ne veux pas enregistrer de manière spéculative un zillion de formulaires "à deviner". Par exemple, cet outil offre les options suivantes dans un mot - clé Typo Generator.

  • sauter des lettres
  • lettres doubles
  • lettres inversées
  • sauter des espaces
  • clé manquée
  • clé insérée

Ce qui est génial et génère des dizaines sinon des centaines de noms de domaines possibles ... mais cela ne dit pas le plus crucial: lequel de ces fautes d'orthographe survient le plus avec de vrais utilisateurs live sur Internet?

Comment puis-je trouver des données erronées sur des utilisateurs réels?

Réponses:


25

Il existe quelques ressources sur Wikipedia, mais vous devez être assez chanceux pour avoir un domaine qui est un mot anglais simple et vanille, assez commun pour apparaître ici.

Vous pouvez utiliser l' outil Générateur de frappe de mots clés , ou quelque chose du genre, puis saisir péniblement chacun d'eux dans Google - qui, ironiquement, tentera de corriger votre orthographe - puis utilisez la "recherche à la place de {version mal orthographiée}" et voyez le nombre de recherches effectuées. résultats que vous obtenez pour cette faute d'orthographe spécifique:

Affichage des résultats pour Treatise

Rechercher à la place pour tretise

Cela donne environ 117 000 résultats pour "tretise" contre 17 800 000 résultats pour "traité". Vous avez donc maintenant une idée de la fréquence des erreurs d’orthographe sur Internet! Vous pouvez ainsi favoriser les erreurs d’orthographe qui se produisent plus souvent dans le monde réel.

Peut-être plus important encore, j'ai aussi trouvé ces pages:

http://how-to-spell.net/treatise

Comment épeler traité?

Correct: traité .

Fautes d'orthographe courantes: trétise - 100%

Ce qui apparemment fait utiliser des données réelles!

Nous avons collecté des pourcentages de fautes d'orthographe provenant de près de 15 423 252 sessions de vérification orthographique sur le site Web spellchecker.net (janv. 2010 - juin 2012).

Dans l'idéal, j'aimerais que Google partage des données sur les fautes d'orthographe, car je soupçonne qu'ils en ont beaucoup plus .. mais je ne sais pas s'ils sont disposés à les partager. avantage compétitif.

Ce serait génial s'ils le faisaient!


2
N'oubliez pas que vous pouvez également demander à vos utilisateurs!
Alex L

2
Le corpus de mots Google Triliion incluait sûrement des mots correctement et incorrectement orthographiés, de sorte que vous puissiez l'utiliser ainsi que de nombreux calculs et chiffres pour les calculer vous-même à partir de données brutes que Google partage.
hippietrail

OpenDNS et Google Public DNS ont certes ce type d’informations, mais ils ne les divulguent pas, mais les utilisent plutôt pour améliorer leurs propres services (OpenDNS est doté d’une fonction de correction des fautes de frappe). Vous pouvez démarrer votre propre service DNS libre / libre et collecter des données, je suppose.
Christian Davén

1
Je ne pense pas que l’utilisation des résultats de Google soit une bonne idée (même si cela n’est pas pratique). Comme xkcd le souligne sur son blag , "le" nombre de résultats "que Google donne lorsque vous effectuez une recherche est clairement fabriqué".
rodrigoq

9

Problème intéressant. Vous pouvez utiliser l'outil de recherche par mot-clé de Google à l' adresse https://adwords.google.com/o/KeywordTool pour savoir combien de recherches sont effectuées par mois pour chacune de vos fautes de frappe de nom de domaine (vous devez générer une liste de fautes de outil que vous mentionnez ci-dessus). Pas parfait, mais représenterait les fautes de frappe des utilisateurs et vous donnerait des données correctes. (Je viens de le tester et j'ai obtenu des résultats qui semblaient raisonnables.)


Malheureusement, ce n'est plus vrai maintenant que nous avons Hummingbird. Google Keyword Tool a été deprecated. Il a été remplacé par Keyword Planner, un produit Google AdSense.
Ellie Kesselman

4

Question intéressante, l’analyse des résultats de recherche décrits ici devrait constituer un bon point de départ, mais elle est sensible aux faux positifs causés par d’autres sites Web portant des noms semblables au vôtre. Il peut également manquer des erreurs courantes auxquelles vous n'avez pas pensé. En regardant la liste, je dirais qu'analyser le changement de mots peut aussi être intéressant.

Une méthode particulièrement efficace pour découvrir les erreurs commises le plus souvent par les visiteurs courants consiste à leur demander de taper le nom. Bien sûr, tous les sites Web ne sont pas adaptés à cette situation, en supposant que la page soit interactive, elle devrait donc convenir parfaitement.

Plutôt que d'utiliser des captcha ordinaires, montrez simplement quelques-uns des logos de votre site avec (une partie de) le nom qui y est écrit et demandez aux personnes de le taper avant de pouvoir faire leur travail.

Les données ne seront pas basées sur une énorme population, comme Google, mais ce sera exactement le groupe cible et les résultats devraient donc être assez puissants.


1

Vous pouvez essayer ce moteur typo finder . Les options de recherche suivantes, individuellement ou en combinaison:

  • Claviers QWERTY
  • Échange de lettres
  • Touches collantes, pour les lettres supplémentaires ou manquantes
  • Semblables à la lettre lou au chiffre1

Il existe trois "points de vue" pour la recherche. Le titulaire est la valeur par défaut. Le DNS est une vue triable indiquant le serveur de noms et l'adresse IP de chaque frappe. Le TLD trouve des fautes de frappe dans les noms de l’un de ces six TLD: .com .net .org .biz .us .infoet s’il est enregistré.

Est-ce différent de l'outil de mots clés d'OP? Peut être. Il prétend "trouver les fautes de frappe communes associées aux noms de domaine". Cela signifie que les données ont été collectées auprès des utilisateurs lorsqu'ils ont saisi manuellement les noms de domaine dans la barre de navigation de leur navigateur .

  • La recherche par "touches collantes" inclut les variantes courantes, avec ou sans trait d'union. Ces sortes de fautes de frappe ne sont pas dues à des touches collantes, mais à des erreurs de perception humaine. Cela indique une utilisation de quelque chose de mieux qu'une approche basée sur des règles et utilisant un système expert.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.