Est-il possible de rechercher des sites MediaWiki à l'aide d'expressions régulières?


9

Je voudrais rechercher des expressions utilisant des expressions régulières sur des sites tels que Wikipédia et Wikimedia Commons. Est-il possible de faire cela?

Exemple de requête de recherche d'expressions rationnelles: (facebook | google) (historique de l'entreprise | sites Web)

Il est déjà possible de faire la même chose sur Google ( comme démontré ici ), donc je veux savoir si c'est également possible pour Wikipedia.


Seriez-vous prêt à télécharger plusieurs gigaoctets de données et à effectuer tout le filtrage sur votre propre ordinateur?
svick

Il semble possible de le faire en utilisant AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/…
Anderson Green

Vous pouvez utiliser AWB pour rechercher une certaine page (ou un ensemble de pages), mais pas tout le wiki, ce que je supposais être ce que vous vouliez.
svick

Oui, je voulais rechercher le wiki entier. Y a-t-il des outils sur le serveur d'outils pour cela?
Anderson Green

Réponses:


3

Il est possible de rechercher sur Wikipedia (ou sur tout autre site auquel un moteur de recherche peut accéder) à l'aide d'expressions régulières simples, tant que vous vous appuyez sur un moteur de recherche. La requête de recherche Google suivante recherche dans Wikipedia les correspondances de l'expression régulière (Yahoo|Google|Microsoft):

https://www.google.com/#hl=en&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & pbx = 1 & bav = on .2, ou .r_cp.r_qf. & Bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639



2

Il est disponible et propulsé par le CirrusSearch (basé sur ElasticSearch ) qui est le moteur de recherche utilisé dans les sites MediaWiki et la plateforme Wikimedia.

Quelques exemples d'utilisation:

Remarque: référence complète du guide et source - sur Wikipédia: Aide: Recherche # Search_string_syntax .

Quant à votre question:

Opérateurs logiques

Le moteur de recherche prend en charge la logique booléenne dans les recherches. Les opérateurs logiques incluent le caractère "-" (signe moins) pour "non logique", les ET, les OU et les parenthèses de regroupement: (_).

OU logique doit être orthographié en majuscules; l'opérateur AND est supposé pour tous les termes (séparés par des espaces), mais AND capital est équivalent.

Plus d'exemples:

  • Simple AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- fonctionnera comme prévu.
  • Suffixé tilde caractère pour la recherche floue ( « sons comme ») - Par exemple, la recherche de charlie~ parker~rendements Charlie Parker, Charles Palmer, Charley Parks(jusqu'à deux différence de caractère, non compris le premier).
  • Recherche générique - recherche face*e- commence par faceet se termine par un eavec quoi que ce soit au milieu. entrez la description de l'image ici

Lecture supplémentaire

En savoir plus sur le moteur de recherche et cette extension pour dévoiler toutes leurs fonctionnalités et fonctionnalités.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.