Der Wert des Attributs wird mit BeautifulSoup abgerufen

8

Ich schreibe ein Python-Skript, das die Script-Speicherorte nach dem Parsen von einer Webseite extrahiert. Nehmen wir an, es gibt zwei Szenarien:

%Vor%

und

%Vor%

Ich kann das JS aus dem zweiten Szenario holen, das heißt, wenn das JS in die Tags geschrieben wird.

Aber gibt es einen Weg, ich könnte den Wert von src aus dem ersten Szenario bekommen (dh alle Werte von src Tags aus dem Skript extrahieren, wie zB Ссылка )

Hier ist mein Code

%Vor%

Ausgabe : Einige JS

Ausgabe erforderlich : Ссылка

    
aditya.gupta 11.09.2013, 05:03
quelle

3 Antworten

22

Es werden nur alle src -Werte angezeigt, wenn sie vorhanden sind. Sonst würde das <script> -Tag

übersprungen %Vor%

Ich erhalte folgende zwei src -Werte als Ergebnis

%Vor%

Ich denke, das ist was du willst. Hoffe, das ist nützlich.

    
Venkateshwaran Selvaraj 11.09.2013, 09:42
quelle
5

Holen Sie 'src' vom Skriptknoten.

%Vor%     
rajpy 11.09.2013 05:16
quelle
1

Dies sollte funktionieren. Sie müssen nur filtern, um alle Skript-Tags zu finden, und dann bestimmen, ob sie ein Attribut 'src' haben. Wenn dies der Fall ist, ist die URL zum JavaScript im src-Attribut enthalten, ansonsten nehmen wir an, dass sich das Javascript im Tag befindet.

%Vor%

Dieser Ausgang ist

%Vor%     
Ashok Fernandez 11.09.2013 09:40
quelle