J'essaye de faire une classification de texte en utilisant Textblob. Je commence par entraîner le modèle et je le sérialise à l'aide de pickle comme indiqué ci-dessous.
import pickle
from textblob.classifiers import NaiveBayesClassifier
with open('sample.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
f = open('sample_classifier.pickle', 'wb')
pickle.dump(cl, f)
f.close()
Et quand j'essaye d'exécuter ce fichier:
import pickle
f = open('sample_classifier.pickle', encoding="utf8")
cl = pickle.load(f)
f.close()
J'obtiens cette erreur:
UnicodeDecodeError: le codec 'utf-8' ne peut pas décoder l'octet 0x80 en position 0: octet de départ invalide
Voici le contenu de mon sample.csv:
Mon SQL ne fonctionne pas du tout correctement. C'était un mauvais choix, SQL
J'ai des problèmes. Veuillez répondre immédiatement, Support
Où vais-je mal ici? Veuillez aider.