Existe-t-il des API pour analyser le résumé du papier?


13

Si j'ai une très longue liste de noms d'articles, comment puis-je obtenir un résumé de ces articles sur Internet ou dans une base de données?

Les noms de papier sont comme "Évaluation de l'utilité dans le Web Mining pour le domaine de la santé publique".

Est-ce que quelqu'un connaît une API qui peut me donner une solution? J'ai essayé d'explorer Google Scholar, mais Google a bloqué mon robot.


2
Je doute qu'il existe une API générale pour cela. Vous pouvez essayer d'explorer divers services comme Academia.edu, les sites des éditeurs, etc. Néanmoins, il serait plus facile de créer d'abord une base de données locale de documents, puis d'expérimenter l'extraction des résumés.
Wojciech Walczak

Merci pour votre réponse! J'ai déjà construit une base de données locale pour cela. Le problème de l'exploration à partir de divers services est que je dois faire des règles d'analyse pour chaque site Web.
Alex Gao

Alors, que diriez-vous de convertir des PDF en TXT puis d'extraire les résumés avec des expressions régulières?
Wojciech Walczak

THX! Cependant, le contrat stipule que le téléchargement massif de documents n'est pas autorisé. Cela crée des maux de tête.
Alex Gao

2
Je pense que ce lien de réponse de débordement de pile donne la meilleure réponse que je puisse obtenir. Peut-être que les personnes qui rencontrent ce problème pourraient également consulter cette page.
Alex Gao

Réponses:


8

Cherchez sur:

Si vous obtenez une seule correspondance de titre exacte, vous avez probablement trouvé le bon article et pouvez y compléter le reste des informations. Les deux vous offrent des liens de téléchargement et une sortie de style bibtex. Ce que vous voudriez probablement faire pour obtenir des métadonnées parfaites est de télécharger et d'analyser le pdf (le cas échéant) et de rechercher l'identifiant de style DOI.

Soyez gentil et limitez vos demandes si vous le faites.


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.