Je lis ce livre ( NLTK ) et c'est déroutant. L'entropie est définie comme : L'entropie est la somme de la probabilité de chaque étiquette multipliée par la probabilité logarithmique de cette même étiquette Comment puis-je appliquer l' entropie et l'entropie maximale en termes d'exploration de texte? Quelqu'un peut-il me …
Je cherche un moyen de diviser un texte en n-grammes. Normalement, je ferais quelque chose comme: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Je suis conscient que nltk ne propose que des bigrammes et des trigrammes, mais …
Je veux vérifier dans un programme Python si un mot est dans le dictionnaire anglais. Je pense que l'interface nltk wordnet pourrait être la solution, mais je n'ai aucune idée de comment l'utiliser pour une tâche aussi simple. def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower()) À l'avenir, …
Je commence tout juste à utiliser NLTK et je ne comprends pas très bien comment obtenir une liste de mots à partir d'un texte. Si j'utilise nltk.word_tokenize(), j'obtiens une liste de mots et de ponctuation. Je n'ai besoin que des mots à la place. Comment puis-je me débarrasser de la …
J'ai donc un ensemble de données que je voudrais supprimer des mots vides d'utilisation stopwords.words('english') J'ai du mal à utiliser cela dans mon code pour simplement supprimer ces mots. J'ai déjà une liste des mots de cet ensemble de données, la partie avec laquelle je me bats est de comparer …
Dans le script shell, je vérifie si ces packages sont installés ou non, s'ils ne sont pas installés, installez-le. Donc avec le script shell: import nltk echo nltk.__version__ mais il arrête le script shell à la importligne dans le terminal Linux a essayé de voir de cette manière: which nltk …
J'ai du mal à utiliser pip pour installer presque tout. Je suis nouveau dans le codage, alors j'ai pensé que c'était peut-être quelque chose que j'avais mal fait et j'ai choisi de ne pas utiliser easy_install pour obtenir la plupart de ce dont j'avais besoin, ce qui a généralement fonctionné. …
Je suivais un tutoriel qui était disponible dans les parties 1 et 2 . Malheureusement, l'auteur n'a pas eu le temps pour la dernière section qui impliquait d'utiliser la similitude cosinus pour trouver réellement la distance entre deux documents. J'ai suivi les exemples de l'article à l'aide du lien suivant …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.