Wie konvertiert man von HTML zu UTF-8 in Java

8

Ich habe einen ASCII-String mit HTML-Entitäten wie:

%Vor%

Ich brauche diese Zeichenfolge ohne diese Entitäten und wandle sie in UTF-8-Zeichen um. Gibt es einen einfachen Weg, dies in Java zu tun?

Wo:

%Vor%

gibt "aà"

zurück

oder so?

    
Llistes Sugra 13.05.2010, 10:25
quelle

1 Antwort

15

Sehen Sie sich org.apache an .commons.lang.StringEscapeUtils.unescapeHtml (...) . Anscheinend versteht es alle in HTML 4 definierten Zeichenentitäten.

    
Stephen C 13.05.2010, 10:37
quelle

Tags und Links