J'ai une chaîne qui ressemble à ceci:
6Â 918Â 417Â 712
La manière claire de couper cette chaîne (si je comprends bien Python) est simplement de dire que la chaîne est dans une variable appelée s
, nous obtenons:
s.replace('Â ', '')
Cela devrait faire l'affaire. Mais bien sûr, il se plaint que le caractère non ASCII '\xc2'
du fichier blabla.py n'est pas codé.
Je n'ai jamais tout à fait pu comprendre comment basculer entre différents encodages.
Voici le code, c'est vraiment le même que ci-dessus, mais maintenant c'est dans son contexte. Le fichier est enregistré au format UTF-8 dans le bloc-notes et a l'en-tête suivant:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
Le code:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
Cela ne va pas plus loin que s.replace
...
u