Lesen Sie Joel Spolsky ausgezeichneten Artikel zu diesem Thema .
Ein interessanter Punkt, der in der Diskussion einer anderen Antwort erwähnt wurde (die ich nicht wirklich für nötig hielt, um den Autor zu löschen) ist, dass es einen Unterschied zwischen einem Zeichensatz gibt, der ( Die Wörter des anderen Autors - ich erinnere mich nicht an seinen Benutzernamen - definieren eine Abbildung zwischen Ganzzahlen und Zeichen (zB "Capital A ist 65") und eine Kodierung , die definiert, wie diese Integer dargestellt werden sollen ein Bytestrom. Die meisten alten Zeichensätze wie ASCII haben nur eine sehr einfache Codierung: Jede ganze Zahl wird genau ein Byte. Der Unicode-Zeichensatz hingegen hat viele verschiedene Kodierungen, von denen keine gleich einfach sind: UTF-8, UTF-16, UTF-32 ...
Tags und Links encoding