utf-8

UTF-8 ist eine Zeichencodierung, die jeden Unicode-Codepunkt mit einer Bytefolge von ein bis vier Byte beschreibt. Es ist abwärtskompatibel zu ASCII und unterstützt weiterhin die Darstellung aller Unicode-Codepunkte.
4
Antworten

Implementieren Sie eine Funktion, um zu überprüfen, ob ein String / Byte-Array dem utf-8-Format folgt

Ich versuche diese Interviewfrage zu lösen.    Nach gegebener Definition des UTF-8-Formats. zB: 1-Byte:   0b0xxxxxxx 2-Byte: .... Wurde gebeten, eine Funktion zu schreiben, um zu überprüfen, ob   Die Eingabe ist gültig UTF-8. Eingabe wird Str...
06.03.2015, 01:24
6
Antworten

So entfernen Sie Unicode-Zeichen (LEFT_TO_RIGHT_MARK) aus einer Zeichenfolge in PHP

Ich versuche LEFT-TO-RIGHT-MARK (\ u200e) und RIGHT-TO-LEFT-MARK (\ u200f) aus einem String zu entfernen, bevor ich es als JSON kodiere. Keines der folgenden scheint zu funktionieren: %Vor% Jede Hilfe ist willkommen!     
18.12.2009, 18:48
4
Antworten

Die VM läuft mit dem nativen Namen encoding von latin1, was zu Fehlfunktionen von Elixir führen kann, da utf8 erwartet wird

Wie kann ich diese Warnung lösen, die bei jeder Ausführung von Elixir-Code oder Eingabe von iex ? angezeigt wird?    Warnung: Die VM läuft mit der nativen Namenscodierung von latin1, was dazu führen kann, dass Elixir nicht richtig funktioni...
04.09.2015, 21:59
3
Antworten

Kodierung von Binärdaten in XML: Gibt es bessere Alternativen als base64?

Ich möchte Binärdaten in einer XML-Datei (mit Python, aber was auch immer) codieren und dekodieren. Ich muss mich der Tatsache stellen, dass ein XML-Tag-Inhalt illegale Zeichen hat. Die einzigen zulässigen sind in XML-Spezifikationen beschrieb...
25.06.2013, 15:52
2
Antworten

Nicht-englische (ASCII) Zeichen in der URL für SEO zulassen?

Ich habe viele UTF-8-Inhalte, die ich für SEO-Zwecke in die URL einfügen möchte. Zum Beispiel, Post-Tags, die ich in th URI aufnehmen möchte ( site.com/tags/id/TAG-NAME ). Von den Standards sind jedoch nur ASCII-Zeichen zulässig.    Zeichen...
06.01.2010, 19:23
2
Antworten

Android zeigt Text nach der Aktualisierung auf Java 8 in falscher Codierung an

Ich habe mein Projekt auf SDK Version 24 und Java 8 aktualisiert und bin auf ein seltsames Codierproblem gestoßen. Aus irgendeinem seltsamen Grund behandelt Android meine hartcodierten UTF-8-Strings als Windows-1251 und daher ist der Text ver...
15.09.2016, 14:56
1
Antwort

Laden der UTF-8-Datei in Python 3 mit numpy.genfromtxt

Ich habe eine CSV-Datei, die ich von der WHO-Website heruntergeladen habe ( Ссылка , Downloads, Mehrzwecktisch im CSV-Format "). Ich versuche, die Datei in ein numpy Array zu laden. Hier ist mein Code: %Vor% Und ich bekomme    UnicodeDeco...
07.10.2015, 19:59
2
Antworten

Wie kann ich Oracle VARCHAR2-Werte aus einer Liste möglicher Kodierungen in UTF-8 konvertieren?

Aus älteren Gründen haben wir in unserer Oracle 10-Datenbank eine VARCHAR2-Spalte, in der die Zeichencodierung auf AL32UTF8 gesetzt ist, die einige Nicht-UTF-8-Werte enthält. Die Werte befinden sich immer in einem dieser Zeichensätze: US-...
03.10.2012, 21:45
2
Antworten

Mysql vier chinesischen Zeichen unterstützen

Ich kann dieses SQL-Skript nicht ausführen: %Vor% Der Fehler ist:    FEHLER 1366: Falscher Zeichenfolgenwert: '\ xF0 \ xA0 \ xBC \ xAD' für Spalte 'Name' in Zeile 1   SQL-Anweisung:   INSERT INTO mabase .% Co_de% ( new_table , idnew_...
16.07.2013, 15:04
2
Antworten

Sind IRIs als HTML-Attributwerte gültig?

Ist die Verwendung von IRIs mit Nicht-ASCII-Zeichen als Attributwerte (z. B. für href -Attribute) anstelle von URIs zulässig? Gibt es Unterschiede zwischen den HTML-Varianten (HTML und XHTML, 4 und 5)? Mindestens RFC 3986 scheint zu implizi...
28.12.2012, 19:35