Questions marquées «html-parsing»



9
Analyser une chaîne HTML avec JS
J'ai cherché une solution mais rien n'était pertinent, voici donc mon problème: Je souhaite analyser une chaîne contenant du texte HTML. Je veux le faire en JavaScript. J'ai essayé cette bibliothèque mais il semble qu'elle analyse le code HTML de ma page actuelle, pas à partir d'une chaîne. Parce que …


3
Quel analyseur HTML est le meilleur? [fermé]
Dans l'état actuel des choses, cette question ne convient pas à notre format de questions / réponses. Nous nous attendons à ce que les réponses soient étayées par des faits, des références ou une expertise, mais cette question suscitera probablement un débat, des arguments, des sondages ou une discussion approfondie. …

7
Analyse HTML à l'aide de Python
Je recherche un module d'analyse HTML pour Python qui peut m'aider à obtenir les balises sous la forme de listes / dictionnaires / objets Python. Si j'ai un document du formulaire: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something else</div> </div> </body> </html> alors cela devrait me donner …



5
Comment analyser une page HTML avec Node.js
J'ai besoin d'analyser (côté serveur) de grandes quantités de pages HTML. Nous sommes tous d'accord pour dire que l'expression rationnelle n'est pas la voie à suivre ici. Il me semble que javascript est la manière native d'analyser une page HTML, mais cette hypothèse repose sur le code côté serveur ayant …

8
Comment extraire une chaîne en suivant un modèle avec grep, regex ou perl
J'ai un fichier qui ressemble à ceci: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> J'ai besoin d'extraire tout ce qui se trouve dans les guillemets qui suivent name=, c'est-à-dire content_analyzer, content_analyzer2et content_analyzer_items. Je fais cela sur une machine Linux, …

8
Comment normaliser le HTML en JavaScript ou jQuery?
Les balises peuvent avoir plusieurs attributs. L'ordre dans lequel les attributs apparaissent dans le code n'a pas d'importance. Par exemple: <a href="#" title="#"> <a title="#" href="#"> Comment puis-je "normaliser" le HTML en Javascript, pour que l'ordre des attributs soit toujours le même? Peu m'importe quel ordre est choisi, tant qu'il …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.