15
n-grammes en python, quatre, cinq, six grammes?
Je cherche un moyen de diviser un texte en n-grammes. Normalement, je ferais quelque chose comme: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Je suis conscient que nltk ne propose que des bigrammes et des trigrammes, mais …