Unterschied zwischen UTF-Kodierungen?

8

Ich habe eine einfache Frage - was ist der Unterschied zwischen UTF-8 , UTF-16 und UTF-32 ? Ich weiß, dass codierte Zeichenketten unterschiedliche Größen haben, aber wofür sind UTF-16 und UTF-32 ? Sollte UTF-8 nicht in der Lage sein, alle Sprachen korrekt zu behandeln? Und wie passt UTF-7 dazu?

BEARBEITEN

Ok, ich verstehe die technische Seite des Ganzen relativ gut, aber ich sehe immer noch keinen Grund, warum ich zum Beispiel UTF-16 anstelle von UTF-8 in meiner App verwenden sollte. Also meine Frage ist - was ist die praktische Verwendung von anderen Kodierungen dann UTF-8 ?

    
Petr Mensik 10.06.2012, 17:28
quelle

2 Antworten

2

Dieser Artikel des berühmten Joel Spolsky erklärt es perfekt: Ссылка

Quote:

  

Es gibt Hunderte von traditionellen Codierungen, die nur einige Codepunkte korrekt speichern und alle anderen Codepunkte in Fragezeichen ändern können. Einige beliebte Kodierungen von englischem Text sind Windows-1252 (der Windows 9x Standard für westeuropäische Sprachen) und ISO-8859-1, auch bekannt als Latin-1 (auch nützlich für jede westeuropäische Sprache). Versuchen Sie jedoch, russische oder hebräische Buchstaben in diesen Kodierungen zu speichern, und Sie erhalten eine Reihe von Fragezeichen. UTF 7, 8, 16 und 32 haben alle die schöne Eigenschaft, jeden Codepunkt korrekt speichern zu können.

    
Gerald Spreer 10.06.2012, 17:38
quelle
0

Vielleicht helfen die Unicode-FAQ ?

Es gibt eine Vergleichstabelle, die einige der Unterschiede zusammenfasst.

    
MutterMumble 10.06.2012 17:36
quelle

Tags und Links