Ist es möglich, sprachspezifische Zeichen in UTF8 in lateinische Zeichen zu konvertieren?

Question

Ist es möglich, sprachspezifische Zeichen in UTF8 in lateinische Zeichen zu konvertieren?

8

Ich frage mich, ob es irgendwelche Beziehungen oder existierende Algorithmen gibt, die die Umwandlung von nationalen Zeichen in äquivalente lateinische Zeichen innerhalb der UTF8-Codepage erlauben?

Zum Beispiel (auf Polnisch):

Ą - & gt; A

Ó - & gt; O

ż - & gt; z

¼ - & gt; z ...

Satz wie: 'zażółć gęślą jażń'

konvertiert zu: 'zazolc gesla jazn'

Zur Zeit verwende ich ein Konvertierungs-Array für Polnisch, aber ich suche nach einer universellen Lösung, die alle lateinischen Sprachen behandelt.

Danke

unicode c#-4.0

tomekole 14.06.2011, 10:39

quelle

3 Antworten

Tags und Links unicode c#-4.0

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Ist der Flash-Bereich frei von Rennbedingungen?

score 1 · Answer 1

1

Überprüfen Sie dies:

Ссылка

Im Allgemeinen suchen Sie nach etwas namens iconv

carlo.borreo 14.06.2011 10:42

quelle

score 1 · Answer 2

Um die Antwort zu vervollständigen, führte mich die "Unicode-Dekomposition + C #" zu diesem CodeProject-Artikel (codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print), der eine fertige Lösung bietet. Die Fähigkeit zu benennen, was Sie suchen, kann nicht unterschätzt werden;) Danke für alle Antworten.

score 0 · Answer 3

0

Nicht ganz sicher, dass dies eine definitive Antwort ist, die Sie brauchen werden, aber wenn ich dies in der Vergangenheit tun musste, habe ich alle "speziellen" Zeichen in eine benannte oder numerische Einheit umgewandelt, so dass sie geschützt sind während des Konvertierungsprozesses.

Pooli 14.06.2011 10:45

quelle