Laden Sie alle Dateien eines bestimmten Typs von einer Website mit wget herunter

Question

Laden Sie alle Dateien eines bestimmten Typs von einer Website mit wget herunter

8

Das Folgende hat nicht funktioniert. Ich weiß nicht, warum es nur in der Start-URL aufhört, gehe nicht in die Links hinein, um nach dem angegebenen Dateityp zu suchen.

wget -r -A.pdf home_page_url

Jede andere Möglichkeit zum rekursiven Herunterladen aller PDF-Dateien auf einer Website. ?

recursion wget screen-scraping

SoulMan 16.08.2013, 13:33

quelle

2 Antworten

Tags und Links recursion wget screen-scraping

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Kombination von vims Falte und Verdeckungsfunktion

score 1 · Answer 1

1

Es kann auf einer robots.txt basieren. Versuchen Sie, -e robots=off hinzuzufügen.

Andere mögliche Probleme sind die Cookie-basierte Authentifizierung oder die Agent-Zurückweisung für wget. Siehe diese Beispiele.

EDIT: Der Punkt in ".pdf" ist falsch nach sunsite.univie.ac. um

rimrul 16.08.2013 13:39

quelle

score 1 · Answer 2

1

das folgende cmd funktioniert für mich, es wird Bilder einer Seite herunterladen

%Vor%

telehan 03.06.2015 06:27

quelle