Laden Sie alle Dateien eines bestimmten Typs von einer Website mit wget herunter

8

Das Folgende hat nicht funktioniert. Ich weiß nicht, warum es nur in der Start-URL aufhört, gehe nicht in die Links hinein, um nach dem angegebenen Dateityp zu suchen.

  

wget -r -A.pdf home_page_url

Jede andere Möglichkeit zum rekursiven Herunterladen aller PDF-Dateien auf einer Website. ?

    
SoulMan 16.08.2013, 13:33
quelle

2 Antworten

1

Es kann auf einer robots.txt basieren. Versuchen Sie, -e robots=off hinzuzufügen.

Andere mögliche Probleme sind die Cookie-basierte Authentifizierung oder die Agent-Zurückweisung für wget. Siehe diese Beispiele.

EDIT: Der Punkt in ".pdf" ist falsch nach sunsite.univie.ac. um

    
rimrul 16.08.2013 13:39
quelle
1

das folgende cmd funktioniert für mich, es wird Bilder einer Seite herunterladen

%Vor%     
telehan 03.06.2015 06:27
quelle

Tags und Links