J'utilise BeautifulSoup et j'analyse certains HTML.
J'obtiens certaines données de chaque HTML (en utilisant la boucle for) et j'ajoute ces données à une certaine liste.
Le problème est que certains HTML ont un format différent (et ils ne contiennent pas les données que je veux) .
Donc, j'essayais d'utiliser la gestion des exceptions et d'ajouter de la valeur nullà la liste (je devrais le faire car la séquence de données est importante.)
Par exemple, j'ai un code comme:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
et certains des liens n'en ont pas <dd class='title'>, donc ce que je veux faire est d'ajouter une chaîne nullà la liste à la place.
L'erreur apparaît:
list index out of range.
Ce que j'ai fait, c'est d'ajouter quelques lignes comme ceci:
if not dlist[1]:
newlist.append('null')
continue
Mais ça ne marche pas. Il montre toujours une erreur:
list index out of range.
Que dois-je faire à ce sujet? Dois-je utiliser la gestion des exceptions? ou y a-t-il un moyen plus simple?
Aucune suggestion? Toute aide serait vraiment géniale!
Nonec'est clairement plus propre, l'OP veut'null'dans ce cas.