html-agility-pack

HTML Agility Pack ist ein Open-Source-HTML-Parser, der ein Lese- / Schreib-DOM erstellt und Linq, Plain XPATH oder XSLT unterstützt.
3
Antworten

Wie schütze ich mich gegen XSS-Angriffe in Attributen wie src?

Also habe ich einen C # html-Desinfektor mit HTML Agility mit einer weißen Liste erstellt. Es funktioniert gut, außer für Fälle wie diese: %Vor% Ich möchte das src-Attribut erlauben, nur nicht bösartiges Zeug in ihm offensichtlich. All die S...
07.03.2013, 20:54
6
Antworten

Auswählen von Attributwerten mit HTML Agility Pack

Ich versuche, ein bestimmtes Bild aus einem HTML-Dokument mit HTML Agility Pack und diesem Xpath: abrufen %Vor% Soweit ich sehen kann, findet es das src-Attribut, aber es gibt das img-Tag zurück. Warum ist das so? Ich würde erwarten, dass...
12.02.2009, 15:57
3
Antworten

Ermittelt einen Wert eines Attributs mit XPath und HtmlAgilityPack

Ich habe ein HTML-Dokument und parst es mit XPath. Ich möchte einen Wert der Elementeingabe erhalten, aber es hat nicht funktioniert. Mein Html: %Vor% Mein Code: %Vor% Also Ich möchte den Wert: "10743" erhalten (und es macht mir nic...
29.12.2011, 10:47
2
Antworten

So entfernen Sie Kommentare aus HTML mit Agility Pack, ohne DOCTYPE zu verlieren

Ich versuche, unnötigen Inhalt aus HTML zu entfernen. Insbesondere möchte ich Kommentare entfernen. Ich habe eine ziemlich gute Lösung gefunden ( Meta-Tags und Kommentare mit Hilfe von HTML Agility Pack ), aber der DOCTYPE wird als Kommentar beh...
04.07.2011, 05:06
1
Antwort

Wie behebt man schlecht formatierten HTML mit HTML Agility Pack?

Ich habe dieses schlecht geformte HTML mit überlappenden Tags: %Vor% Die Überlappung kann auch verschachtelt werden. Wie kann ich es mit HTML Agility Pack (HAP) in wohlgeformten HTML-Code umwandeln? Ich suche nach dieser Ausgabe: %...
26.03.2014, 12:51
2
Antworten

Wie man HTML-Tags mit HTMLAgilityPack repariert (die Tags zum Öffnen und Schließen fehlen)

Ich habe einen HTML-Code mit <div><h1> hello Hi</div> <div>hi </p></div> Erforderliche Ausgabe: <div><h1> hello </h1></div> <div><p>hi </p></div> Mit...
23.08.2013, 06:56
1
Antwort

HTML Agility Pack erstellt einen neuen HTMLNode

Ich verwende HTML Agility Pack, um eine HTML-Datei zu analysieren und zu transformieren, aber ich erhalte die Ausnahme "Element wurde bereits hinzugefügt", wenn ich versuche, einen neuen HTML-Knoten wegen des Index-Parameters zu erstellen. %Vo...
15.03.2011, 09:50
2
Antworten

So extrahieren Sie die vollständige URL mit HtmlAgilityPack - C #

In Ordnung mit dem Weg unten extrahiert es nur Verweis-URL wie folgt der Extraktionscode: %Vor% Der URL-Code %Vor% Die extrahierte URL %Vor% Aber ich möchte einen echten Link bekommen, welcher Browser wie geparst wird %Vor% Ic...
13.10.2011, 20:52
3
Antworten

htmlagilitypack und dynamischer Inhalt Problem

Hallo alle zusammen. Ich möchte eine Web-Scrapper-Anwendung erstellen, und ich möchte es mit Webbrowser-Steuerelement, htmlagilitypack und XPath tun. Im Moment habe ich es geschafft, einen xpath Generator zu erstellen (ich habe dazu einen...
16.04.2012, 06:17
5
Antworten

Verlust des 'less than'-Zeichens in HtmlAgilityPack loadhtml

Ich habe kürzlich damit begonnen, mit dem HtmlAgilityPack zu experimentieren. Ich bin nicht mit all seinen Möglichkeiten vertraut und denke deshalb mache ich etwas falsch. Ich habe eine Zeichenfolge mit folgendem Inhalt: %Vor% Sie sehen,...
24.03.2011, 15:25