Irgendeinen Unicode-Buchstaben?

8

In .net können Sie \p{L} verwenden, um einen beliebigen Buchstaben zu finden. Wie kann ich das Gleiche in Python machen? Ich möchte nämlich alle Großbuchstaben, Kleinbuchstaben und Buchstaben mit Akzenten anpassen.

    
mpen 11.06.2011, 07:05
quelle

1 Antwort

19

Pythons re -Modul unterstützt noch keine Unicode-Eigenschaften. Sie können Ihre Regex jedoch mit dem Flag re.UNICODE kompilieren, und dann entspricht die Kurzschrift der Zeichenklasse \w ebenfalls Unicode-Buchstaben.

Da \w auch Ziffern entspricht, müssen Sie diese zusammen mit dem Unterstrich von Ihrer Zeichenklasse subtrahieren:

%Vor%

passt auf jeden Unicode-Buchstaben.

%Vor%     
Tim Pietzcker 11.06.2011, 07:09
quelle