character-properties

character-properties sind Attribute, die vom Unicode-Standard bereitgestellt werden. Für jedes darin enthaltene Zeichen werden viele Eigenschaften in Bezug auf Prozesse oder Algorithmen angegeben, die sie interpretieren, um das Zeichenverhalten zu implementieren.
1
Antwort

Irgendeinen Unicode-Buchstaben?

In .net können Sie \p{L} verwenden, um einen beliebigen Buchstaben zu finden. Wie kann ich das Gleiche in Python machen? Ich möchte nämlich alle Großbuchstaben, Kleinbuchstaben und Buchstaben mit Akzenten anpassen.     
11.06.2011, 07:05
5
Antworten

Wie passe ich nur vollständig zusammengesetzte Zeichen in einer Unicode-Zeichenfolge in Perl an?

Ich suche nach einer Möglichkeit, nur vollständig zusammengesetzte Zeichen in einer Unicode-Zeichenfolge abzugleichen. Ist [:print:] abhängig von der Ländereinstellung in jeder Implementierung eines regulären Ausdrucks, die diese Zeichenkl...
15.10.2008, 03:10
2
Antworten

So bestimmen Sie, ob ein Zeichen ein chinesisches Zeichen ist

Wie kann man mithilfe von Ruby feststellen, ob es sich bei einem Schriftzeichen um ein chinesisches Schriftzeichen handelt?     
28.04.2010, 08:22
3
Antworten

Nach Unicode-Nummern in einer Zeichenkette mit \ d suchen

Laut der Oniguruma-Dokumentation entspricht der Zeichensatz \d :    Dezimalziffer char   Unicode: General_Category - Decimal_Number Beim Scannen nach \d in einer Zeichenfolge mit allen Dezimal_Zeichenzeichen werden jedoch nur latei...
09.08.2011, 15:28
1
Antwort

Regulärer Ausdruck, um die Grenze zwischen verschiedenen Unicode-Skripten zu erreichen

Motoren mit regulärem Ausdruck haben ein Konzept von Übereinstimmungen mit "null Breite", von denen einige nützlich sind, um Kanten von Wörtern zu finden: \b - in den meisten Engines vorhanden, um eine beliebige Grenze zwischen Wort- und...
11.05.2013, 01:39
2
Antworten

Gibt es eine Möglichkeit, alle nicht alphabetischen Unicode-Zeichen zu finden?

Ich habe einige Dokumente, die OCR-Konvertierung von PDF in HTML durchgeführt haben. Aus diesem Grund haben sie viele zufällige Unicode Interpunktion, wo der Konverter vermasselt (d. H. Elipses, etc ...). Sie haben auch eine Reihe von Nicht-Engl...
14.05.2011, 23:32
2
Antworten

Abrufen von Unicode-Zeichen einer Sprache in Java

Gibt es eine Möglichkeit in Java, dass ich alle Unicode-Zeichen einer bestimmten Sprache (zum Beispiel Bengali oder Arabisch) erhalten kann?     
21.11.2010, 10:59