Vous pouvez écrire un logiciel pour:
- Prenez les mots-clés de l'expression régulière;
- Google les mots-clés et obtenir une liste de résultats;
- Analysez chaque URI obtenu et filtrez-le avec une expression régulière complète.
Étudions un cas: site:gog.com
retrouvez tous les jeux avec voix off en espagnol.
L'expression régulière est:
Audio[^:]*:[^.,]*Spanish
Il doit correspondre, par exemple:
Audio lanuage: English, German, Spanish, French.
Et ne correspond pas:
Audio language: only-English. Text language: Spanish.
Étape 1. Laissez votre logiciel effectuer cette recherche sur Google:
site:gog.com audio Spanish inurl:game
inurl:game
ici signifie seulement rechercher dans les pages de description de jeu
Étape 2. Obtenez les 300 liens résultants et explorez chacun d'entre eux.
Étape 3. Filtrez le résultat avec l'expression régulière donnée:
Audio[^:]*:[^.,]*Spanish
Cela devrait être facile à construire. En fait, je ne comprends pas pourquoi je ne pouvais pas trouver quelque chose qui est déjà construit de cette façon.
Étant donné que les moteurs de recherche ne peuvent pas se permettre que les ressources analysent leurs données avec une expression régulière, ce travail délicat vous incombe et votre ordinateur doit le faire avec ce que les moteurs de recherche fournissent déjà.