.Net Entfernen Sie JavaScript und CSS-Code-Blöcke von HTML-Seite

7

Ich habe HTML als Zeichenfolge mit Javascript und CSS-Code-Blöcke.

In etwa so:

%Vor%

Aber ich brauche sie nicht. Wie kann ich diese Blöcke mit reqular Ausdrücke entfernen?

    
Ievgen Naida 17.06.2011, 08:34
quelle

4 Antworten

15

Die schnelle 'n' schmutzige Methode wäre eine Regex wie folgt:

%Vor%

Die bessere * (aber möglicherweise langsamere) Option wäre HtmlAgilityPack :

%Vor%

*) Eine Diskussion darüber, warum es besser ist, finden Sie unter Dieser Thread .

    
Elian Ebbing 17.06.2011, 09:20
quelle
2

Verwenden Sie HTMLAgilityPack für bessere Ergebnisse

oder probieren Sie diese Funktion

%Vor%     
CodeWrite 17.06.2011 10:47
quelle
1

Suchen Sie einfach nach einem öffnenden <script -Tag und entfernen Sie dann alles zwischen ihm und dem schließenden /script> -Tag.

Gleiches gilt für den Stil. Siehe Google für Tipps zur String-Manipulation.

    
cusimar9 17.06.2011 08:38
quelle
1

Ich habe mein Fahrrad gemacht) Er ist vielleicht nicht so korrekt wie HtmlAgilityPack, aber es ist viel schneller um etwa 5-6 mal auf einer Seite in den 400 kb. Machen Sie auch Symbole in Kleinbuchstaben und entfernen Sie Ziffern (für Tokenizer)

%Vor%     
Suhan 03.07.2013 09:05
quelle

Tags und Links