Ich versuche, alle Links einer sitemap.xml zu crawlen, um eine Website erneut zu cachen. Aber die rekursive Option von wget funktioniert nicht, ich bekomme nur als Antwort:
Die Remote-Datei existiert, enthält jedoch keine Verknüpfung - sie wird nicht abgerufen.
Aber sicher ist die Sitemap.xml voll von "http: // ..." Links.
Ich habe fast jede Option von wget ausprobiert, aber nichts hat für mich funktioniert:
%Vor%Weiß jemand, wie man alle Links innerhalb einer Website sitemap.xml öffnet?
Danke, Dominik
Tags und Links web-crawler wget sitemap.xml