Ich lese eine Datei, die rumänische Wörter in Python mit file.readline () enthält. Ich habe wegen der Kodierung Probleme mit vielen Zeichen.
Beispiel:
%Vor%Ich habe encode () mit utf-8, cp500 usw. versucht, aber es funktioniert nicht.
Ich kann nicht finden, welches die richtige Zeichencodierung ist, die ich verwenden muss?
Danke im Voraus.
Bearbeiten: Das Ziel ist es, das Wort aus der Datei in einem Wörterbuch zu speichern und beim Ausdrucken eine aberaţie und nicht 'abera \ xc8 \ x9bie'
zu erhaltenWas versuchst du zu tun?
Dies ist eine Menge von Bytes:
%Vor% Es ist eine Menge von Bytes, die eine utf-8
-Kodierung der Zeichenfolge "aberaţie" darstellt. Sie decodieren die Bytes, um Ihre Unicode-Zeichenfolge zu erhalten:
Wenn Sie die Unicode-Zeichenfolge in einer Datei speichern möchten, müssen Sie sie in ein bestimmtes Byteformat Ihrer Wahl encodieren:
%Vor%Tags und Links python encoding file decoding representation