UnicodeDecodeError: 'ascii' Codec kann nicht dekodieren

8

Ich lese eine Datei, die rumänische Wörter in Python mit file.readline () enthält. Ich habe wegen der Kodierung Probleme mit vielen Zeichen.

Beispiel:

%Vor%

Ich habe encode () mit utf-8, cp500 usw. versucht, aber es funktioniert nicht.

Ich kann nicht finden, welches die richtige Zeichencodierung ist, die ich verwenden muss?

Danke im Voraus.

Bearbeiten: Das Ziel ist es, das Wort aus der Datei in einem Wörterbuch zu speichern und beim Ausdrucken eine aberaţie und nicht 'abera \ xc8 \ x9bie'

zu erhalten     
lilawood 30.06.2011, 21:21
quelle

1 Antwort

15

Was versuchst du zu tun?

Dies ist eine Menge von Bytes:

%Vor%

Es ist eine Menge von Bytes, die eine utf-8 -Kodierung der Zeichenfolge "aberaţie" darstellt. Sie decodieren die Bytes, um Ihre Unicode-Zeichenfolge zu erhalten:

%Vor%

Wenn Sie die Unicode-Zeichenfolge in einer Datei speichern möchten, müssen Sie sie in ein bestimmtes Byteformat Ihrer Wahl encodieren:

%Vor%     
Claudiu 30.06.2011, 21:26
quelle