Ich habe eine vom Benutzer gesendete Zeichenfolge, die HTML-Inhalt enthält, z. B.
%Vor% Ich möchte diese Zeichenfolge so transformieren, dass leere Tag-Paare entfernt werden (aber leere Tags wie <br/>
werden beibehalten). Das Ergebnis dieser Umwandlung sollte beispielsweise die obige Zeichenfolge in
Ich würde gerne JSoup dazu verwenden, da ich dies bereits in meinem Klassenpfad habe, und es wäre für mich am einfachsten, diese Transformation auf der Serverseite durchzuführen.
Nicht wirklich vertraut mit jsoup, aber Sie könnten dies mit einem einfachen Regex ersetzen:
%Vor%Obwohl Sie mit einem vollständigen Parser wahrscheinlich nur leere Inhalte während der Verarbeitung löschen können, je nachdem, was Sie letztendlich damit machen werden.
Jsoup macht aus Benutzereingabe-HTML korrektes XML. Verwenden Sie den XML-Parser, um alle leeren Tags zu finden und zu entfernen. Ich denke, es ist eine bessere Idee als Regexp. Schau hier: Java Entferne leere XML-Tags Sie können JSoup auch verwenden, um leere Tags für Sie zu finden. Schau hier: Ссылка und verwenden Sie die Node.remove () -Methode.
Wenn Sie jQuery verwenden, können Sie es wie
tun %Vor%Geige: Ссылка
nicht wissen, die Jsoup, unten Code funktioniert auch mit einfachen Javascript regex. Probieren Sie den folgenden Code.
%Vor%}
Tags und Links java jsoup html-parsing