C # Regex zum Entfernen nicht druckbarer Zeichen und Steuerzeichen in einem Text, der aus vielen verschiedenen Sprachen besteht, Unicode-Buchstaben

8

Ich würde mich über Ihre Hilfe freuen, da ich nicht weiß, welche Zeichen zu verwenden sind oder ob es eine Zeichenklasse wie [[: cntrl:]] gibt, die ich in Ruby gefunden habe?

mit nicht druckbaren, ich meine lösche alle Zeichen, die nicht in ie Ausgabe gezeigt werden, wenn man die Eingabezeichenkette druckt. Bitte beachten Sie, ich suche nach einem c # Regex, ich habe kein Problem mit meinem Code

    
foksoho 12.11.2016, 15:58
quelle

2 Antworten

11

Sie können alle Steuerzeichen und andere nicht druckbare Zeichen mit

entfernen %Vor%

Die Kategorie \p{C} Unicode-Kategorie stimmt mit allen Steuerzeichen überein, sogar mit denen außerhalb der ASCII-Tabelle, da Unicode-Klassen in .NET standardmäßig Unicode-fähig sind.

    
Wiktor Stribiżew 12.11.2016 23:32
quelle
1

Sie können versuchen mit:

%Vor%

Aktualisierte Antwort nach Kommentaren:

Dokumentation über nicht druckbare Zeichen: Ссылка

Char.IsControl-Methode:

Ссылка

Vielleicht können Sie es versuchen:

%Vor%     
Yanga 12.11.2016 16:03
quelle

Tags und Links