J'ai un fichier html avec beaucoup de texte UTF-8 encodé à% dans les URL.
Par exemple, "% D1% 80% D0% B5% D1% 81% D1% 83% D1% 80% D1% 81% D1% 8B" signifie "ресурсы" ("ressources" en russe).
La tâche consiste à remplacer toutes ces sous-chaînes par du texte UTF-8 lisible.
Pour simplifier la tâche, nous pouvons considérer qu'il n'y a pas d'autre %
utilisation de signe dans le fichier. Les chiffres des lettres peuvent être en majuscules et en minuscules.
Je soupçonne que cela peut être fait avec élégance sed
, perl
, awk
ou quelque chose , mais ne savent pas comment.
Cette application Web semble faire l'affaire avec le texte que vous y collez.