Ce code ouvre l'url et ajoute le /names
à la fin et ouvre la page et imprime la chaîne à test1.csv
:
import urllib2
import re
import csv
url = ("http://www.example.com")
bios = [u'/name1', u'/name2', u'/name3']
csvwriter = csv.writer(open("/test1.csv", "a"))
for l in bios:
OpenThisLink = url + l
response = urllib2.urlopen(OpenThisLink)
html = response.read()
item = re.search('(JD)(.*?)(\d+)', html)
if item:
JD = item.group()
csvwriter.writerow(JD)
else:
NoJD = "NoJD"
csvwriter.writerow(NoJD)
Mais j'obtiens ce résultat:
J,D,",", ,C,o,l,u,m,b,i,a, ,L,a,w, ,S,c,h,o,o,l,....
Si je change la chaîne en ("JD", "Columbia Law School" ....) alors j'obtiens
JD, Columbia Law School...)
Je n'ai pas pu trouver dans la documentation comment spécifier le délimiteur.
Si j'essaie d'utiliser, delimenter
j'obtiens cette erreur:
TypeError: 'delimeter' is an invalid keyword argument for this function
Merci pour l'aide.
delimiter
et pasdelimeter
: docs.python.org/library/csv.html