strip Tags python

8

Ich möchte die folgende Funktionalität.

%Vor%

d. Entfernen Sie den Inhalt des angegebenen Tags

    
developer 06.04.2010, 12:52
quelle

9 Antworten

9

Lösung mit BeautifulSoup :

%Vor%

gibt zurück:

%Vor%     
zoli2k 06.04.2010, 13:21
quelle
5

Mit BeautifulSoup:

%Vor%

Gefunden bei Ссылка

    
Brian 06.04.2010 13:04
quelle
3

Wenn Ihnen Python nichts ausmacht (obwohl Regexps ziemlich generisch sind), können Sie sich etwas von Djangos strip_tags Filter .

Hier reproduziert für die Vollständigkeit -

%Vor%

BEARBEITEN: Wenn Sie diese oder eine andere Regexp-Lösung verwenden, beachten Sie bitte, dass sie sorgfältig gestalteten HTML-Code (siehe Kommentar) sowie HTML-Kommentare durchlässt und daher nicht mit nicht vertrauenswürdigen Eingaben verwendet werden sollte. Erwägen Sie stattdessen, einige der Antworten beautifulsoup, html5lib oder lxml für nicht vertrauenswürdige Eingaben zu verwenden.

    
Sam 06.04.2010 13:05
quelle
2

Versuchen Sie es mit:

%Vor%     
systempuntoout 06.04.2010 13:04
quelle
2

Sieht so aus, als wolltest du HTMLParser . ( html.parser in Python 3.)

%Vor%     
Mike DeSimone 06.04.2010 13:09
quelle
0

Ich würde Ссылка verwenden, wenn Sie einige sichere Tags einfügen möchten.

Weitere Informationen finden Sie im Abschnitt "Desinfektion von Tokenizern" unter Ссылка .

Denken Sie daran, Schwachstellen zu testen, wenn es sich um einen wichtigen Dienst handelt: Ссылка .

    
cryo 06.04.2010 13:14
quelle
0

Dies ist Code aus meinem Projekt Supybot , also ist es ziemlich gut getestet:

%Vor%

Wie der Docstring bemerkt, stammte es von Fredrik Lundh, nicht von mir. Wie sie sagen, stehlen große Autoren:)

    
jemfinch 06.04.2010 14:06
quelle
0

Sams Antwort sollte, soweit ich das beurteilen kann, ziemlich genau das tun, was ich wollte, aber es kann sich lohnen, dafür zu sorgen, dass irgendwelche übrig gebliebenen & lt; & gt; Zeichen werden durch & amp; lt ersetzt; und & amp; gt; bzw. um Missbrauch / ungültiges HTML zu verhindern.

Dieser Ansatz hat den Vorteil, dass er unglaublich fehlerhafte HTML-Referenzen / -Tags akzeptieren kann. BeautifulSoup behandelt auch schlecht formatierte Tags ziemlich gut, aber html5lib, sgmllib und htmllib können an ungültigem Code ersticken, manche mehr als andere, wenn ich mich richtig erinnere.

Der folgende Code validiert & amp; HTML-Verweise:

%Vor%     
cryo 06.04.2010 13:51
quelle
0

Verwenden Sie das webob.exc-Modul:

%Vor%

Und dann benutze es:

%Vor%     
thiago marini 07.12.2014 18:07
quelle

Tags und Links