Questions marquées «html-content-extraction»



8
Extraire une partie d'une correspondance regex
Je veux une expression régulière pour extraire le titre d'une page HTML. Actuellement, j'ai ceci: title = re.search('<title>.*</title>', html, re.IGNORECASE).group() if title: title = title.replace('<title>', '').replace('</title>', '') Existe-t-il une expression régulière pour extraire uniquement le contenu de <title> pour ne pas avoir à supprimer les balises?

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.