Wie man HTML-Tags mit HTMLAgilityPack repariert (die Tags zum Öffnen und Schließen fehlen)

9

Ich habe einen HTML-Code mit <div><h1> hello Hi</div> <div>hi </p></div>

Erforderliche Ausgabe: <div><h1> hello </h1></div> <div><p>hi </p></div>

Mit HTML Agility Pack ist es möglich, diese Art von ähnlichen Problemen mit fehlenden schließenden und öffnenden Tags zu beheben?

    
Raghavendra 23.08.2013, 06:56
quelle

2 Antworten

13

Die Bibliothek ist nicht intelligent genug, um die Erstellungsstelle p zu erstellen, wo Sie sie angeben, aber sie ist intelligent genug, um das fehlende h1 zu erstellen. Und im Allgemeinen erzeugt es immer gültiges HTML, aber nicht immer das, was Sie erwarten würden.

Also dieser Code:

%Vor%

löscht dies:

%Vor%

Was Sie nicht wollen, ist aber gültiges HTML. Sie können auch einen kleinen Trick wie folgt hinzufügen:

%Vor%

das wird dump dies:

%Vor%     
Simon Mourier 23.08.2013, 08:06
quelle
7

Wenn es geht HtmlAgilityPack.HtmlDocument.LoadHTML(yourhtml) HTMLAgilityPack repariert die Tags automatisch für Sie und Sie können dann auf diese Tags zugreifen mit: HtmlAgilityPack.HtmlDocument.DocumentNode.OuterHTML

    
user2280232 28.03.2014 23:13
quelle

Tags und Links