Unicode ist ein Standard für die Kodierung, Darstellung und Handhabung von Text mit der Absicht, alle Zeichen zu unterstützen, die für den geschriebenen Text erforderlich sind und alle Schriftsysteme, technischen Symbole und Interpunktion enthalten.
Ich habe eine Datei mit Sätzen, von denen einige auf Spanisch sind und Akzentbuchstaben (z. B. é) oder Sonderzeichen (z. B. ¿) enthalten. Ich muss in der Lage sein, nach diesen Zeichen im Satz zu suchen, damit ich feststellen kann, ob der Satz i...
10.11.2012, 20:22
Ich versuche, ein C # -Programm zu machen, das Unicode-Zeichen von seinem hexadezimalen Format in ein einzelnes Zeichen übersetzt, und ich habe ein Problem. Das ist mein Code:
Das funktioniert:
%Vor%
Dies funktioniert jedoch nicht:
%Vor...
03.07.2011, 17:14
Ich habe einen einfachen Konverter in Python gemacht, um Bilder in ASCII zu konvertieren. Im Moment verwendet es verschiedene Schattierungen von dunklen Zeichen, so dass es funktioniert, aber es ist schwer mit niedrigen Auflösungen zu erkennen:...
07.12.2011, 15:55
Die XML-Spezifikation definiert eine Teilmenge von Unicode-Zeichen, die in XML-Dokumenten zulässig sind:
Ссылка .
Wie filtere ich diese Zeichen aus einem String in Java heraus?
einfacher Testfall:
%Vor%
24.05.2010, 12:54
Ich mache ein Konsolen-basiertes Kartenspiel in f # und ich habe Probleme, Kartenanzüge mit Unicode-Zeichen anzuzeigen. Die Zuordnung von suit-to-char wird wie folgt dargestellt:
%Vor%
Anzeige mit
%Vor%
funktioniert gut in fsi:
ab...
22.01.2017, 22:53
Ich schreibe einen Lambda-Kalkül-Interpreter für Spaß und Übung. Ich habe Iostreams, um Bezeichner richtig zu tokenisieren, indem ich eine ctype -Facette hinzufüge, die Interpunktion als Whitespace definiert:
%Vor%
( classic_table() wä...
26.02.2010, 05:00
Hinweis: Diese Frage kann auf Systemen, die das enthaltene Emoji nicht unterstützen, seltsam aussehen.
Dies ist eine Folgefrage an Wie entferne ich Emoji aus der Zeichenfolge? .
Ich möchte einen regulären Ausdruck erstellen, der all...
11.07.2014, 10:02
TomC empfiehlt, Unicode-Zeichen auf dem Weg zu dekomprimieren und auf dem Weg nach außen neu zu setzen ( Ссылка ).
Ersteres macht für mich Sinn, aber ich kann nicht verstehen, warum er auf dem Weg nach draußen die Neuzusammensetzung empfiehlt...
04.04.2012, 13:41
Ich entwickle einen Webservice, der Zeichen mithilfe der PHP GD-Erweiterung unter Verwendung einer benutzerdefinierten TTF-Schriftart rendert.
Das funktioniert im ASCII-Land gut, aber es gibt ein paar Probleme:
Die zu rendernde Zeichenfo...
21.05.2010, 02:42
Laut der Oniguruma-Dokumentation entspricht der Zeichensatz \d :
Dezimalziffer char
Unicode: General_Category - Decimal_Number
Beim Scannen nach \d in einer Zeichenfolge mit allen Dezimal_Zeichenzeichen werden jedoch nur latei...
09.08.2011, 15:28