Entfernen aller HTML-Tags zusammen mit ihrem Inhalt aus dem Text

8

Ich frage mich, wie ich alle HTML-Tags zusammen mit ihren Inhalten mit BeautifulSoup löschen kann.

Eingabe:

%Vor%

Ausgabe:

%Vor%     
Adam Silver 26.08.2013, 21:17
quelle

2 Antworten

16

Verwenden Sie replace_with() (oder replaceWith() ):

%Vor%

druckt:

%Vor%

Oder, wie @mata vorgeschlagen hat, können Sie tag.decompose() anstelle von tag.replaceWith('') verwenden - wird das gleiche Ergebnis liefern, sieht aber passender aus.

    
alecxe 26.08.2013, 21:30
quelle
0

Dies ist für XML, wenn Sie es für HTML wollen, ändern Sie den Import von BeautifulStoneSoup nach BeautifulSoup

%Vor%     
dilbert 26.08.2013 22:07
quelle