Der Begriff "Unicode-Zeichen" ist nicht spezifisch genug. Es würde jedem -Zeichen entsprechen, das im Unicode-Bereich liegt, also auch "normale" Zeichen. Dieser Begriff wird jedoch sehr oft verwendet, wenn ein tatsächlich bedeutet, dass Zeichen nicht im druckbaren ASCII-Bereich enthalten sind ".
In regulären Ausdrücken wäre das [^\x20-\x7E]
.
Je nachdem, was Sie mit diesen Informationen machen möchten, hier einige nützliche Antworten:
Liegt das daran, dass informa
überhaupt keine Teilzeichenfolge von informátion
ist?
Wie würde Ihr Code funktionieren, wenn Sie die letzte a
von informa
in Ihrer Regex entfernt hätten?