Questions marquées «nltk»

Le Natural Language Toolkit est une bibliothèque Python pour la linguistique informatique.


15
Échec du chargement de english.pickle avec nltk.data.load
Lorsque vous essayez de charger le punkttokenizer ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... un a LookupErrorété soulevé: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource: nltk.download(). Searched in: > - 'C:\\Users\\Martinos/nltk_data' > - 'C:\\nltk_data' > - 'D:\\nltk_data' > - …
144 python  jenkins  nltk 


15
n-grammes en python, quatre, cinq, six grammes?
Je cherche un moyen de diviser un texte en n-grammes. Normalement, je ferais quelque chose comme: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Je suis conscient que nltk ne propose que des bigrammes et des trigrammes, mais …
137 python  string  nltk  n-gram 

9
Comment vérifier si un mot est un mot anglais avec Python?
Je veux vérifier dans un programme Python si un mot est dans le dictionnaire anglais. Je pense que l'interface nltk wordnet pourrait être la solution, mais je n'ai aucune idée de comment l'utiliser pour une tâche aussi simple. def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower()) À l'avenir, …
134 python  nltk  wordnet 



12
Comment supprimer les mots vides en utilisant nltk ou python
J'ai donc un ensemble de données que je voudrais supprimer des mots vides d'utilisation stopwords.words('english') J'ai du mal à utiliser cela dans mon code pour simplement supprimer ces mots. J'ai déjà une liste des mots de cet ensemble de données, la partie avec laquelle je me bats est de comparer …
110 python  nltk  stop-words 



17
Ressource u'tokenizers / punkt / english.pickle 'introuvable
Mon code: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') Message d'erreur: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 16, in <module> tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load opened_resource = _open(resource_url) File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open return find(path_, path + ['']).open() File "/usr/lib/python2.6/site-packages/nltk/data.py", line …
96 python  unix  nltk 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.