Quels sont les types de contenu corrects pour les documents XML, HTML et XHTML?
J'ai besoin d'écrire un simple robot d'exploration qui ne récupère que ces types de fichiers.
De nos jours, http://example.net/index.html peut servir par exemple un fichier JPEG en raison de mod_rewrite, je dois donc vérifier le type de contenu à partir de l'en-tête de réponse et le comparer avec une liste de types de contenu autorisés.
D'où puis-je obtenir une telle liste?