Ich frage mich, ob es irgendwelche Beziehungen oder existierende Algorithmen gibt, die die Umwandlung von nationalen Zeichen in äquivalente lateinische Zeichen innerhalb der UTF8-Codepage erlauben?
Zum Beispiel (auf Polnisch):
Ą - & gt; A
Ó - & gt; O
ż - & gt; z
¼ - & gt; z ...
Satz wie: 'zażółć gęślą jażń'
konvertiert zu: 'zazolc gesla jazn'
Zur Zeit verwende ich ein Konvertierungs-Array für Polnisch, aber ich suche nach einer universellen Lösung, die alle lateinischen Sprachen behandelt.
Danke
Um die Antwort zu vervollständigen, führte mich die "Unicode-Dekomposition + C #" zu diesem CodeProject-Artikel (codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print), der eine fertige Lösung bietet. Die Fähigkeit zu benennen, was Sie suchen, kann nicht unterschätzt werden;) Danke für alle Antworten.
Nicht ganz sicher, dass dies eine definitive Antwort ist, die Sie brauchen werden, aber wenn ich dies in der Vergangenheit tun musste, habe ich alle "speziellen" Zeichen in eine benannte oder numerische Einheit umgewandelt, so dass sie geschützt sind während des Konvertierungsprozesses.