utf-16

UTF-16 ist eine Zeichencodierung, die Unicode-Codepunkte mit 2 oder 4 Byte pro Zeichen darstellt.
4
Antworten

Python UTF-16 CSV-Reader

Ich habe eine UTF-16 CSV-Datei, die ich lesen muss. Python CSV-Modul scheint UTF-16 nicht zu unterstützen. Ich benutze Python 2.7.2. CSV-Dateien, die ich parsen muss, sind riesig, da sie mehrere GB Daten umfassen. Antworten auf John Machin...
07.02.2012, 14:16
7
Antworten

Gibt es eine Standardtechnik zum Packen von Binärdaten in eine UTF-16-Zeichenfolge?

(In .NET) Ich habe willkürliche Binärdaten in einem Byte [] (ein Bild zum Beispiel) gespeichert. Jetzt muss ich diese Daten in einer Zeichenfolge speichern (ein "Kommentar" -Feld einer alten API). Gibt es eine Standardtechnik für packen di...
24.02.2015, 02:14
3
Antworten

Pandas read_csv und UTF-16

Ich habe eine CSV-Textdatei in UTF-16 codiert (um Unicode-Zeichen zu erhalten, wenn andere Excel verwenden), aber wenn ich eine reads_csv mit Pandas 0.9.0 mache, bekomme ich diesen kryptischen Fehler: %Vor% Lesen der Daten zeilenweise mit cs...
03.12.2012, 19:18
5
Antworten

Ist es möglich, Benutzerdateien zuverlässig automatisch in Unicode zu decodieren? [C #]

Ich habe eine Webanwendung, mit der Benutzer ihren Inhalt zur Verarbeitung hochladen können. Die Verarbeitungs-Engine erwartet UTF8 (und ich erstelle XML aus mehreren Benutzerdateien), also muss ich sicherstellen, dass ich die hochgeladenen Date...
22.02.2010, 20:58
2
Antworten

Welche Konsequenzen hat das Speichern einer C # -Zeichenfolge (UTF-16) in einer SQL Server-nvarchar-Spalte (UCS-2)?

Offenbar verwendet SQL Server Unicode UCS-2 , eine 2-Byte-Zeichencodierung mit fester Länge, für nchar/nvarchar -Felder. In der Zwischenzeit verwendet C # die Unicode-Codierung UTF-16 für seine Strings (Anmerkung: Manche Leute betrachten U...
13.04.2011, 20:36
2
Antworten

Wie erhalten Sie eine zuverlässige Anzahl von Unicode-Zeichen in Python?

Google App Engine verwendet Python 2.5.2, anscheinend mit UCS4 aktiviert. Aber der GAE-Datenspeicher verwendet intern UTF-8. Wenn Sie also u '\ ud834 \ udd0c' (Länge 2) im Datenspeicher speichern, erhalten Sie beim Abrufen '\ U0001d10c' (Länge 1...
03.08.2011, 06:26
0
Antworten

SonarQube - Analyse von XML- und XSD-Dateien mit UTF-16-Codierung nicht möglich

Ich verwende sonarqube (Version 5.6.7 ) und Sonar-Scanner (Version 3.0.3.778 ) zur Analyse einiger Dokumente. Unter diesen Dokumenten befinden sich auch .xml und .xsd Dateien mit der Deklaration UTF-16 . Wenn ich meinen sonar-scan...
03.01.2018, 11:17