Oui, parfois .
Il y a deux choses qui se produisent couramment. Votre lien ne fonctionne plus, donc je ne suis pas sûr du scénario réel dans ce cas, donc je vais résumer sur un autre lien.
Redirection HTTP
C'est ce que vous voyez avec Bit.ly
et d'autres services. Il s'agit alors de fournir une réponse de redirection HTTP. Lorsque vous visitez http://bit.ly/oH3410, il redirige vers l'URL réelle. Parfois, une URL redirige vers une autre. Vous pouvez voir cela se produire si vous branchez l'URL sur http://web-sniffer.net/ ou en utilisant, [curl][1] -I http://bit.ly/oH3410
vous verrez un 301 renvoyant vers un nouvel emplacement.
Donc, pour gérer la redirection HTTP, il vous suffit de boucler une demande HTTP HEAD jusqu'à ce que vous ne receviez plus de réponses dans les 300 (espérons-le, 200). Gardez à l'esprit qu'il est possible qu'ils redirigent en boucle, ce qui ne finira jamais. Vous pouvez le faire avec CURL ou tout autre outil HTTP.
Page de téléchargement
C'est ce que la plupart des sites de téléchargement utilisent. Vous cliquez sur le lien de téléchargement et il vous amène à une page avec un tas d'annonces et dit "Votre téléchargement va commencer sous peu" quelque chose de similaire. [ Exemple ]. Avec ceux-ci, vous pouvez essayer d'analyser le lien direct réel à partir de l'URL, mais cela serait spécifique au site, et la plupart des sites ne l'incluront pas pour vous empêcher de le contourner. Cela se fait soit via une meta http-equiv="refresh"
balise dans l'en-tête, soit JavaScript (le plus courant). Cependant, le JS a généralement un repli d'en-tête.
Il existe cependant une solution. Si vous regardez la source sur la page de téléchargement, vous verrez généralement une <meta http-equiv="refresh">
balise (généralement dans une <noscript>
balise) avec un attribut URL
qui pointe vers le téléchargement réel. Utilisez donc CURL (ou tout autre outil HTTP) pour télécharger la page, analysez-la et récupérez cette valeur. Un site peut cependant exclure cela s'il veut être vraiment méchant, vous obligeant ainsi à avoir JavaScript pour télécharger des fichiers.
Il existe probablement un bloc JavaScript qui renvoie également au téléchargement. Il peut être obscurci ou lié à partir d'une autre URL. Votre kilométrage peut varier en essayant d'analyser cela. Il peut également y avoir un "lien direct" sur la page. Vous pouvez essayer quelques techniques pour le trouver, mais encore une fois, cela pourrait être obscurci via JavaScript ou même manquer tous ensemble.
edit
pour voir la source de démarque pour savoir comment je l'ai fait.