Ist es möglich, sprachspezifische Zeichen in UTF8 in lateinische Zeichen zu konvertieren?

8

Ich frage mich, ob es irgendwelche Beziehungen oder existierende Algorithmen gibt, die die Umwandlung von nationalen Zeichen in äquivalente lateinische Zeichen innerhalb der UTF8-Codepage erlauben?

Zum Beispiel (auf Polnisch):

Ą - & gt; A

Ó - & gt; O

ż - & gt; z

¼ - & gt; z ...

Satz wie: 'zażółć gęślą jażń'

konvertiert zu: 'zazolc gesla jazn'

Zur Zeit verwende ich ein Konvertierungs-Array für Polnisch, aber ich suche nach einer universellen Lösung, die alle lateinischen Sprachen behandelt.

Danke

    
tomekole 14.06.2011, 10:39
quelle

3 Antworten

1

Überprüfen Sie dies:

Ссылка

Im Allgemeinen suchen Sie nach etwas namens iconv

    
carlo.borreo 14.06.2011 10:42
quelle
1

Um die Antwort zu vervollständigen, führte mich die "Unicode-Dekomposition + C #" zu diesem CodeProject-Artikel (codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print), der eine fertige Lösung bietet. Die Fähigkeit zu benennen, was Sie suchen, kann nicht unterschätzt werden;) Danke für alle Antworten.

    
tomekole 15.06.2011 10:01
quelle
0

Nicht ganz sicher, dass dies eine definitive Antwort ist, die Sie brauchen werden, aber wenn ich dies in der Vergangenheit tun musste, habe ich alle "speziellen" Zeichen in eine benannte oder numerische Einheit umgewandelt, so dass sie geschützt sind während des Konvertierungsprozesses.

    
Pooli 14.06.2011 10:45
quelle

Tags und Links