Wenn Sie die Webseite ändern und modifizierten Inhalt zurückgeben möchten, ist der beste Weg, die XSL-Transformation zu verwenden.
Ссылка
Sieh dir Ссылка an, es hat eine benutzerfreundliche dom-ähnliche API, für einfache Aufgaben, die du nicht html parsen musst.
>
Wenn Sie die Webseite ändern und modifizierten Inhalt zurückgeben möchten, ist der beste Weg, die XSL-Transformation zu verwenden.
Ссылка
Es gibt zu viele HTML-Parser. Sie könnten JTidy , NekoHTML oder überprüfen TagSoup .
Normalerweise bevorzuge ich die Syntaxanalyse von XHTML mit den Standard-Java-XML-Parsern, aber Sie können dies nicht für jede Art von HTML tun.
Sehen Sie Ссылка für eine Liste von Java-Bibliotheken, die HTML-Dateien in Java-Objekte analysieren, die sein können manipuliert.
Wenn die HTML-Dateien, mit denen Sie arbeiten, gut formatiert sind (xhtml), können Sie auch XML-Bibliotheken in Java verwenden, um bestimmte Tags zu finden und zu ändern. Die E / A selbst sollte von den jeweiligen Bibliotheken gehandhabt werden.
Wenn Sie die Strings manuell analysieren, können Sie reguläre Ausdrücke verwenden, um bestimmte Tags zu finden und die Java-io-Bibliotheken verwenden, um in die Dateien zu schreiben und neue HTML-Dokumente zu erstellen. Aber diese Methode erfindet das Rad sozusagen neu, weil Sie das Öffnen und Schließen von Tags verwalten müssen, und all diese Dinge werden von bereits vorhandenen Bibliotheken gehandhabt.
Ich mache ein Projekt, bei dem ich eine HTML-Datei lesen und bestimmte Tags identifizieren, den Inhalt des Tags ändern und eine neue HTML-Datei erstellen muss. Gibt es eine Bibliothek, die HTML-Tags analysiert und die Tags in eine neue Datei zurückschreiben kann?
Sehen Sie Ссылка für eine Liste von Java-Bibliotheken, die HTML-Dateien in Java-Objekte analysieren, die sein können manipuliert.
Wenn die HTML-Dateien, mit denen Sie arbeiten, gut formatiert sind (xhtml), können Sie auch XML-Bibliotheken in Java verwenden, um bestimmte Tags zu finden und zu ändern. Die E / A selbst sollte von den jeweiligen Bibliotheken gehandhabt werden.
Wenn Sie die Strings manuell analysieren, können Sie reguläre Ausdrücke verwenden, um bestimmte Tags zu finden und die Java-io-Bibliotheken verwenden, um in die Dateien zu schreiben und neue HTML-Dokumente zu erstellen. Aber diese Methode erfindet das Rad sozusagen neu, weil Sie das Öffnen und Schließen von Tags verwalten müssen, und all diese Dinge werden von bereits vorhandenen Bibliotheken gehandhabt.
Tags und Links html java html-parsing