In meiner Antwort auf Was ist ein einfacher Weg, um die Liste der URLs auf einer Webseite mit Python zu extrahieren? Ich habe das zufällig als Teil des Extraktionsschritts behandelt; Sie könnten leicht eine Methode schreiben, um es auf die Suppe zu tun und nicht nur extrahieren.
%Vor%Tags und Links python lxml beautifulsoup