Der fragliche String hat ein zusätzliches Unicode-Zeichen "\ ud84c \ udfb4". Laut javadoc sollte der Regex-Abgleich auf Codepunkt-Ebene und nicht auf Zeichenebene erfolgen. Der folgende Teilcode behandelt jedoch den niedrigen Ersatz (\ udbb4) al...
Ich denke, die Frage ist ziemlich einfach, brauche ich den Rest des Krams in Unicode nach dem Grundplan? Welche Art von Zeug ist enthalten und wird das wirklich benötigt? (und für welche Zwecke?)
Danke.