Ich schreibe ein Python-Skript, das die Script-Speicherorte nach dem Parsen von einer Webseite extrahiert. Nehmen wir an, es gibt zwei Szenarien:
%Vor%und
%Vor%Ich kann das JS aus dem zweiten Szenario holen, das heißt, wenn das JS in die Tags geschrieben wird.
Aber gibt es einen Weg, ich könnte den Wert von src aus dem ersten Szenario bekommen (dh alle Werte von src Tags aus dem Skript extrahieren, wie zB Ссылка )
Hier ist mein Code
%Vor%Ausgabe : Einige JS
Ausgabe erforderlich : Ссылка
Es werden nur alle src
-Werte angezeigt, wenn sie vorhanden sind. Sonst würde das <script>
-Tag
Ich erhalte folgende zwei src
-Werte als Ergebnis
Ich denke, das ist was du willst. Hoffe, das ist nützlich.
Dies sollte funktionieren. Sie müssen nur filtern, um alle Skript-Tags zu finden, und dann bestimmen, ob sie ein Attribut 'src' haben. Wenn dies der Fall ist, ist die URL zum JavaScript im src-Attribut enthalten, ansonsten nehmen wir an, dass sich das Javascript im Tag befindet.
%Vor%Dieser Ausgang ist
%Vor%Tags und Links python python-2.7 beautifulsoup