unicode

Unicode ist ein Standard für die Kodierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für den geschriebenen Text erforderlich sind und alle Schriftsysteme, technischen Symbole und Interpunktion enthalten.
2
Antworten

Konvertiere oder entferne "illegale" Unicode-Zeichen

Ich habe eine Datenbank in MSSQL, die ich nach SQLite / Django portiere. Ich verwende Pymssql, um eine Verbindung zur Datenbank herzustellen und ein Textfeld in der lokalen SQLite-Datenbank zu speichern. Für einige Charaktere explodiert es je...
24.03.2010, 15:14
3
Antworten

Arbeiten mit Unicode-Strings in Delphi 7

Ich muss ein Programm schreiben, das Strings verschiedener Länge durchblättert und nur diejenigen auswählt, die mit Symbolen aus dem von mir definierten Satz geschrieben sind (insbesondere japanische Buchstaben). Strings enthalten Wörter in vers...
17.02.2010, 14:00
1
Antwort

Schöne Suppe und Unicode-Probleme

Ich verwende BeautifulSoup, um einige Webseiten zu analysieren. Gelegentlich laufe ich in einen "Unicode-Fehler" wie folgt: Mit Blick auf die Quelle dieses Artikels auf TheAtlantic.com [ Ссылка ] Das sehen wir in der og: description Met...
22.10.2013, 03:23
3
Antworten

Wird in einem nvarchar jedes Zeichen immer in zwei Bytes gespeichert?

Ich hatte (vielleicht naiv) angenommen, dass in SQL Server ein nvarchar jedes Zeichen in zwei Bytes speichert. Aber das scheint nicht immer der Fall zu sein. Die Dokumentation gibt an, dass einige Zeichen mehr Bytes benötigen. Hat jemand eine de...
17.01.2011, 13:22
2
Antworten

Gibt es eine Möglichkeit, alle nicht alphabetischen Unicode-Zeichen zu finden?

Ich habe einige Dokumente, die OCR-Konvertierung von PDF in HTML durchgeführt haben. Aus diesem Grund haben sie viele zufällige Unicode Interpunktion, wo der Konverter vermasselt (d. H. Elipses, etc ...). Sie haben auch eine Reihe von Nicht-Engl...
14.05.2011, 23:32
4
Antworten

Konvertieren Sie UTF-8-Oktette in Unicode-Codepunkte

Ich habe einen Satz von UTF-8-Oktetts und muss sie wieder in Unicode-Codepunkte konvertieren. Wie kann ich dies in Python tun. z.B. UTF-8-Oktett ['0xc5', '0x81'] sollte in 0x141-Codepunkt umgewandelt werden.     
08.12.2009, 04:59
4
Antworten

Benötige ich ein zusätzliches Flugzeug?

Ich denke, die Frage ist ziemlich einfach, brauche ich den Rest des Krams in Unicode nach dem Grundplan? Welche Art von Zeug ist enthalten und wird das wirklich benötigt? (und für welche Zwecke?) Danke.     
21.06.2009, 11:06
7
Antworten

Wie werden die Unicode-Zeichenfolgen in C # am besten gehandhabt? [geschlossen]

Kann mir bitte jemand einige wichtige Aspekte mitteilen, die mir beim Umgang mit Unicode-Strings in C # wichtig sein sollten?     
27.09.2008, 20:28
1
Antwort

Problem über 65533 in C # Textdatei lesen

Ich habe eine Beispielanwendung erstellt, um alle Sonderzeichen beim Kopieren von OpenOffice Writer in Notepad zu laden. Doppel-Codes unterscheiden sich und wenn ich versuche, dies zu laden. %Vor% Dies erzeugt das Problem von 65533 Issue kom...
22.02.2013, 10:42
3
Antworten

JSON gibt "irgendein UNICODE-Zeichen" an?

Vielleicht ist das nur meine Unvertrautheit mit Unicode, also korrigiere mich bitte, wenn ich mich irre. Wenn man sich Ссылка anschaut, sagt die Spezifikation, dass eine Zeichenfolge "irgendein UNICODE-Zeichen" enthalten kann, aber das verw...
03.05.2010, 16:18