Où puis-je télécharger la base de données de dictionnaires anglais au format texte? [fermé]


127

J'ai besoin de lire le fichier texte pour un mot et de renvoyer sa signification. Tout autre format de fichier fonctionnera également.


J'ai écrit un clawler Web pour tous les dictionnaires en ligne célèbres (Oxford, Longman, Cambridge, Webster et Collins) que vous pouvez utiliser pour créer votre ensemble de données. github.com/kiasar/Dictionary_crawler
Peyman

Réponses:


62

Le projet Gutenberg héberge le dictionnaire anglais Unabridged de Webster ainsi que de nombreuses autres œuvres littéraires du domaine public. En fait, il semble qu'ils aient plusieurs versions du dictionnaire hébergées avec des droits d'auteur de différentes années. Celui que j'ai lié a un copyright de 2009. Vous voudrez peut-être fouiller sur le site et étudier les différentes versions du dictionnaire Webster.


1
'09 transcription nettoyée de la version 1913, apparemment l'OCR n'était pas complètement propre. Il existe un total de 15 versions sur le site.
DragonLord

57

user1247808 a un bon lien avec: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Si cela ne vous suffit pas:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (URL mise à jour de la suggestion de Michael Kropat)

Bien que ce nom de fichier change, vous voudrez trouver le dernier ... qui se révèle être juste un gros (très gros) fichier texte.

http://dumps.wikimedia.org/enwiktionary/


merci .. pour ce lien
AndyBoy

Vous pouvez toujours télécharger le dernier wiktionary sur dumps.wikimedia.org/enwiktionary/latest/...
Michael Kropat

androidtech / wordnet20 est au format SQL et non au format txt.
DragonLord

1
Remarque: la syntaxe du wordnet20 a un TYPE = * obsolète dans le fichier .sql. Exécutez sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqlpour remplacer la syntaxe obsolète avant de l'exécuter sur une version 5.0+ de MySQL
Serguei Fedorov

pas de simple fichier txt contenant tous les mots anglais?
Nadav B

27

Je ne sais pas si c'est trop tard, mais j'ai pensé que cela aiderait quelqu'un d'autre.

Je voulais vraiment la même chose ... je l'ai finalement trouvée.

Ce n'est peut-être pas parfait, mais pour moi, c'est suffisant (pour ma petite application de dictionnaire).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Ce n'est pas un fichier de vidage, mais un fichier de script MYSQL .sql

Les mots sont dans la table WN_SYNSET et le glossaire / signification dans la table WN_GLOSS


4
Sous quelle licence s'agit-il?
Cole Johnson

2
Je ne suis pas sûr non plus, mais sur androidtech.com/html/downloads.php il y aHere are some files related to natural language and chatterbot projects that we are making available to the public
Betlista

7
Utilisateurs MySQL: les instructions create table utilisent l'option TYPE désormais supprimée. Exécutez ceci sur le fichier sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqlpour le faire fonctionner dans la dernière version de MySQL
anthonygore

15

Vérifiez si ces ressources gratuites correspondent à vos besoins -


8
FOLDOC (Dictionnaire gratuit en ligne de l'informatique) semble être un dictionnaire de termes / noms informatiques uniquement. Cela pourrait être utile pour certains, mais ce n'est pas un dictionnaire général dans
lequel

2
Le lien de la page ObjectGraph est également mort. Les versions officielles téléchargeables se trouvent ici .
Lèse majesté

@ Lèsemajesté votre lien est également mort maintenant
yukashima huksay
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.