character-properties sind Attribute, die vom Unicode-Standard bereitgestellt werden. Für jedes darin enthaltene Zeichen werden viele Eigenschaften in Bezug auf Prozesse oder Algorithmen angegeben, die sie interpretieren, um das Zeichenverhalten zu implementieren.
In .net können Sie \p{L} verwenden, um einen beliebigen Buchstaben zu finden. Wie kann ich das Gleiche in Python machen? Ich möchte nämlich alle Großbuchstaben, Kleinbuchstaben und Buchstaben mit Akzenten anpassen.
11.06.2011, 07:05
Ich suche nach einer Möglichkeit, nur vollständig zusammengesetzte Zeichen in einer Unicode-Zeichenfolge abzugleichen.
Ist [:print:] abhängig von der Ländereinstellung in jeder Implementierung eines regulären Ausdrucks, die diese Zeichenkl...
15.10.2008, 03:10
Wie kann man mithilfe von Ruby feststellen, ob es sich bei einem Schriftzeichen um ein chinesisches Schriftzeichen handelt?
28.04.2010, 08:22
Laut der Oniguruma-Dokumentation entspricht der Zeichensatz \d :
Dezimalziffer char
Unicode: General_Category - Decimal_Number
Beim Scannen nach \d in einer Zeichenfolge mit allen Dezimal_Zeichenzeichen werden jedoch nur latei...
09.08.2011, 15:28
Motoren mit regulärem Ausdruck haben ein Konzept von Übereinstimmungen mit "null Breite", von denen einige nützlich sind, um Kanten von Wörtern zu finden:
\b - in den meisten Engines vorhanden, um eine beliebige Grenze zwischen Wort- und...
11.05.2013, 01:39
Ich habe einige Dokumente, die OCR-Konvertierung von PDF in HTML durchgeführt haben. Aus diesem Grund haben sie viele zufällige Unicode Interpunktion, wo der Konverter vermasselt (d. H. Elipses, etc ...). Sie haben auch eine Reihe von Nicht-Engl...
14.05.2011, 23:32
Gibt es eine Möglichkeit in Java, dass ich alle Unicode-Zeichen einer bestimmten Sprache (zum Beispiel Bengali oder Arabisch) erhalten kann?
21.11.2010, 10:59