Ich möchte den Inhalt einer Website herunterladen, auf der die URLs als
erstellt werdenInnerhalb der URL ist nur Ссылка für jede Seite eindeutig und die Werte für Option1 und Option2 ändern sich. Tatsächlich kann jede einzelne Seite aufgrund dieser Variablen Hunderte verschiedener Notationen enthalten. Ich verwende wget, um den gesamten Inhalt der Seite zu holen. Wegen des Problems habe ich bereits mehr als 3GB Daten heruntergeladen. Gibt es eine Möglichkeit, wget zu sagen, alles hinter dem Fragezeichen der URL zu ignorieren? Ich kann es nicht in den Manpages finden.
Problem gelöst. Ich habe festgestellt, dass die URLs, die ich herunterladen möchte, alle suchmaschinenfreundlich sind, wobei die Beschreibungen mit einem Bindestrich erstellt wurden:
Alle anderen URLs hatten Verweise auf den CMS. Ich habe alles, was ich brauche mit
%Vor%Das hat den Trick gemacht. Danke für den Gedankenaustausch!