Benutze zuerst StringEscapeUtils#unescapeHtml4()
(oder #unescapeXml()
, abhängig vom ursprünglichen Format, um die &
in eine &
zu entfernen. Dann benutze String#replaceAll()
mit [^\x20-\x7e]
, um Zeichen loszuwerden, die sich nicht innerhalb des druckbaren ASCII-Bereichs befinden .
Zusammengefasst:
%Vor%.. welches produziert
%Vor%(ohne den abschließenden Punkt wie in Ihrem Beispiel, aber das war nicht im Original vorhanden;))
Das sieht jedoch so aus, als wäre eine Anfrage an Workaround als eine Anfrage an Lösung . Wenn Sie mehr über die funktionale Anforderung und / oder den Ursprung dieser Zeichenfolge erfahren, können wir möglicherweise die richtige Lösung bereitstellen. Der ®
sieht nämlich so aus, als würde man die falsche Kodierung zum Einlesen des Strings verwenden und das &
sieht so aus, als würde man einen textbasierten Parser anstelle eines vollwertigen HTML-Parsers verwenden, um den String einzulesen.
Sie können die StringEscapeUtils
verwenden Klasse von Apache Commons Lang Projekt.
Tags und Links java special-characters htmlspecialchars