utf-8

UTF-8 ist eine Zeichencodierung, die jeden Unicode-Codepunkt mit einer Bytefolge von ein bis vier Byte beschreibt. Es ist abwärtskompatibel zu ASCII und unterstützt weiterhin die Darstellung aller Unicode-Codepunkte.
4
Antworten

Erkennung des Dateityps "Text" (ANSI vs UTF-8)

Ich habe eine Anwendung (eine psychologische Test-Prüfung) in Delphi (7) geschrieben, die eine Standard-Textdatei erstellt - dh die Datei ist vom Typ ANSI. Jemand hat das Programm portiert, um im Internet zu laufen, wahrscheinlich mit Java, u...
05.02.2011, 16:11
1
Antwort

Referenz: Warum werden meine "speziellen" Unicode-Zeichen mithilfe von json_encode merkwürdig codiert?

Wenn Sie "spezielle" Unicode-Zeichen verwenden, erscheinen sie als merkwürdiger Abfall, wenn sie in JSON codiert sind: %Vor% Warum? Habe ich etwas falsch mit meinen Kodierungen gemacht? (Dies ist eine Referenzfrage, um das Thema ein für...
30.03.2014, 15:12
2
Antworten

Gibt es eine einfache Möglichkeit, UTF-8-Oktette in Visual Studio zu schreiben?

Ich habe ein Problem, ich muss UTF-8-codierte Strings auf Standard-Char-Typen im C ++ - Quellcode verwenden: %Vor% Normalerweise, wenn ich ein UTF-8 Zeichen schreiben möchte, muss ich Oktette wie oben verwenden. Gibt es etwas in Visual Studi...
14.11.2013, 20:13
3
Antworten

Java - Schnellste Möglichkeit, um die Größe von String zu überprüfen

Ich habe den folgenden Code innerhalb einer Schleifenanweisung. In der Schleife werden Strings an sb (StringBuilder) angehängt und geprüft, ob die Größe von sb 5 MB erreicht hat. %Vor% Dies funktioniert gut, aber es ist sehr langsam (in Bez...
24.04.2017, 11:12
2
Antworten

Extrahiere den ersten Buchstaben einer UTF-8-Zeichenfolge mit Lua

Gibt es eine Möglichkeit, den ersten Buchstaben einer UTF-8-codierten Zeichenfolge mit Lua zu extrahieren? Lua unterstützt Unicode nicht korrekt, daher gibt string.sub("ÆØÅ", 2, 2) "?" anstelle von "Ø" zurück. Gibt es einen relati...
05.11.2012, 15:22