HAP wird Ihnen nicht die gewünschten Ergebnisse liefern.
Versuchen Sie, einen .net-Wrapper für HtmlTidy zu verwenden, wie den hier gefundenen hier
%Vor%Ergebnisse:
%Vor%Eine Variante dieser Frage wurde kürzlich beantwortet
Im Grunde genommen war das Ergebnis, dass Sie HtmlAgilityPack verwenden können, um es ein wenig zu bereinigen, indem Sie die fix verschachtelten Tags verwenden.
Die beste Lösung ist es, etwas namens Tidy zu verwenden, eine Anwendung, die ursprünglich von einigen Entwicklern bei w3c erstellt und dann Open Source gemacht wurde. Es ist der Motor, der auch den w3c-Validator antreibt.
In diesem Artikel wird beschrieben, wie Sie es verwenden können, aber Sie müssen sich anmelden (kostenlos), um es anzuzeigen:
Es scheint ein legitimer Artikel zu sein, aber es ist witzig, weil sonst niemand in den letzten sechs Jahren dieses Thema behandelt zu haben scheint ...
Eine ähnliche Frage finden Sie hier: HtmlAgilityPack: Wie wird eingerücktes HTML erstellt? und meine Antwort:
Nein, und es ist eine "von Design" Wahl. Es gibt einen großen Unterschied zwischen XML (oder XHTML, das ist XML, kein HTML) wo - meistens - Leerzeichen sind keine spezifische Bedeutung, und HTML.
Dies ist keine so geringe Verbesserung, wie Das Ändern von Whitespaces kann das ändern So stellen manche Browser ein gegebenes HTML dar Chunk, vor allem fehlerhafte HTML (das ist im Allgemeinen gut durch die Bibliothek). Und das Html Agility Pack wurde entwickelt, um den Weg zu minimieren HTML wird gerendert, nicht so wie der Markup ist geschrieben.
Ich sage nicht, dass es nicht machbar ist oder einfach unmöglich. Natürlich kannst du In XML konvertieren und voilà (und Sie könnte eine Erweiterungsmethode schreiben mache das einfacher) aber das gerendert Ausgabe kann anders sein, in der allgemeiner Fall.
Tags und Links html-agility-pack