Je crée un programme de comptage de mots simple en Java qui lit les fichiers texte d'un répertoire.
Cependant, je continue à recevoir l'erreur:
java.nio.charset.MalformedInputException: Input length = 1
à partir de cette ligne de code:
BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8"));
Je sais que j'obtiens probablement cela parce que j'ai utilisé un Charset
qui n'incluait pas certains des caractères dans les fichiers texte, dont certains incluaient des caractères d'autres langues. Mais je veux inclure ces personnages.
J'ai appris plus tard aux JavaDocs que le Charset
est facultatif et utilisé uniquement pour une lecture plus efficace des fichiers, j'ai donc changé le code en:
BufferedReader reader = Files.newBufferedReader(file);
Mais certains fichiers lancent toujours le fichier MalformedInputException
. Je ne sais pas pourquoi.
Je me demandais s'il existe un forfait tout compris Charset
qui me permettra de lire des fichiers texte avec de nombreux types de caractères différents ?
Merci.
ISO-8859-1
et ça marche bien. Je pense que c'est pour les personnages européens, ce qui est bien.UTF-16
Cependant, je ne sais toujours pas pourquoi cela ne fonctionne pas.