Existe-t-il un moyen de filtrer les tableaux Wikipedia?


12

Je cherche un moyen de filtrer les tableaux que l'on trouve souvent dans les articles Wikipedia, donc je ne peux comparer que les lignes (et colonnes) qui m'intéressent.

Y a-t-il non plus

  1. une fonction intégrée dans le moteur Wikipedia que je ne connais pas
  2. ou un plugin de navigateur qui prend en charge cette

Les caractéristiques auxquelles je peux penser sont:

  • Filtrer par valeur de colonne
  • Masquer les colonnes
  • Tri multi-niveaux

Ahhh ... le champ de mines hors sujet. Voir le point 3 du premier tableau. Je demande quelque chose de spécifique à Wikipedia. En fait, un script Greasemonkey ferait l'affaire, mais n'a pas pu en trouver un
pufferfish

Réponses:


8

Si vous placez cette formule dans une cellule de Google Sheet, elle supprimera les données tabulaires du lien de cet article Wikipedia: http://en.wikipedia.org/wiki/Demographics_of_India

=IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India", "table", 4)

Une fois que vous avez les données dans Google Sheet, vous pouvez filtrer par valeur de colonne (sélectionner l'en-tête de colonne, choisir Filtrer dans le menu Données ) et masquer la colonne (sélectionner la colonne, choisir Masquer la colonne dans le menu contextuel)

Capture d'écran de Google Sheets


1

Les tables? Voulez-vous dire les infoboxes? Vous devriez probablement utiliser Wikidata http://wikidata.org/w/api.php et en extraire les informations (ce sera plus propre), puis le présenter comme vous préférez.

Sinon, vous pouvez saupoudrer display: nonepartout sur les ID et les classes appropriées pour les tables en question, mais ce sera une chasse sans fin d'informations non structurées.


1

Le script Greasemonkey du filtre de table Wikipedia fait ce que vous voulez:

Résumé du script: filtre les tableaux wikipedia en supprimant toutes les lignes qui ont une valeur indésirable ou en supprimant certaines lignes et colonnes.

Vous devrez peut-être ajouter la httpsversion de l'URL de wikiedia à la liste de filtrage des pages incluses du script pour le faire fonctionner.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.