wget funktioniert nicht

8

Unter Ubuntu versuche ich eine Datei (aus einem Skript) mit wget herunterzuladen. Erstellen eines Programms, um diese Datei jeden Tag herunterzuladen und in einen Hadoop-Cluster zu laden.

jedoch schlägt das wget mit der folgenden Nachricht fehl.

%Vor%

Wenn ich die gleiche URL in Firefox oder gleichwertigem versuche, funktioniert es gut. Und ja, es gibt keinerlei Lizenzvereinbarung ...

Fehle ich etwas Grundlegendes bezüglich wget ??

    
Gyan 15.06.2012, 22:11
quelle

5 Antworten

12

Die Site blockiert wget, weil wget standardmäßig einen ungewöhnlichen Benutzeragenten verwendet. Um einen anderen Benutzeragenten in wget zu verwenden, versuchen Sie:

%Vor%     
enderskill 15.06.2012, 22:17
quelle
6

Verwenden:

%Vor%

Einige Websites verhindern einfach, dass wget user-agent Dateien herunterlädt. Ich habe diese Datei gerade mit diesem Befehl heruntergeladen. Es funktioniert.

    
Zagorax 15.06.2012 22:13
quelle
2

Ich verwende curl -O <URL> , weil wget HTTPS und einige andere Protokolle nicht unterstützt.

    
Anas 14.05.2014 07:54
quelle
0

Eine andere Technik, die von Webapps oder Webservern verwendet wird, besteht darin, den Inhalt des Headers "Referrer" zu überprüfen. Zusätzlich zur Angabe des Benutzeragenten muss möglicherweise die Referrer-URL angegeben werden.

z.B.

%Vor%

Dieser Host scheint Anforderungen für die Zieldatei abzulehnen, wenn sie nicht während der Navigation von der Seite 'Scenery1.html' vorgenommen wurden.

    
David Vezzani 19.07.2012 00:36
quelle
0

Einige Websites verhindern einfach, dass wget user-agent Dateien herunterlädt wget -U 'Mozilla / 5.0 (X11; U; Linux i686; de-DE; rv: 1.8.1.6) Gecko / 20070802 SeaMonkey / 1.1.4' Ссылка

    
Bipil Raut 19.07.2014 05:41
quelle

Tags und Links