Un inconvénient majeur curl
est que de plus en plus de pages Web voient leur contenu principal peint par une réponse JavaScript AJAX qui se produit après la réponse HTTP initiale. curl
ne reprend jamais ce contenu post-peint.
Donc, pour récupérer ces types de pages Web à partir de la ligne de commande, j'ai été réduit à écrire des scripts dans Ruby qui conduisent le SeleniumRC à lancer une instance de Firefox, puis à retourner le code HTML source une fois ces appels AJAX terminés.
Il serait préférable d'avoir une solution de ligne de commande plus légère pour ce type de problème. Quelqu'un en connaît-il?