Ich habe einen HTML-Code mit <div><h1> hello Hi</div> <div>hi </p></div>
Erforderliche Ausgabe: <div><h1> hello </h1></div> <div><p>hi </p></div>
Mit HTML Agility Pack ist es möglich, diese Art von ähnlichen Problemen mit fehlenden schließenden und öffnenden Tags zu beheben?
Die Bibliothek ist nicht intelligent genug, um die Erstellungsstelle p
zu erstellen, wo Sie sie angeben, aber sie ist intelligent genug, um das fehlende h1
zu erstellen. Und im Allgemeinen erzeugt es immer gültiges HTML, aber nicht immer das, was Sie erwarten würden.
Also dieser Code:
%Vor%löscht dies:
%Vor%Was Sie nicht wollen, ist aber gültiges HTML. Sie können auch einen kleinen Trick wie folgt hinzufügen:
%Vor%das wird dump dies:
%Vor% Wenn es geht
HtmlAgilityPack.HtmlDocument.LoadHTML(yourhtml)
HTMLAgilityPack repariert die Tags automatisch für Sie und Sie können dann auf diese Tags zugreifen mit: HtmlAgilityPack.HtmlDocument.DocumentNode.OuterHTML
Tags und Links c# html-agility-pack dom