UnicodeDecodeError: 'ascii' Codec kann nicht dekodieren

Question

UnicodeDecodeError: 'ascii' Codec kann nicht dekodieren

8

Ich lese eine Datei, die rumänische Wörter in Python mit file.readline () enthält. Ich habe wegen der Kodierung Probleme mit vielen Zeichen.

Beispiel:

%Vor%

Ich habe encode () mit utf-8, cp500 usw. versucht, aber es funktioniert nicht.

Ich kann nicht finden, welches die richtige Zeichencodierung ist, die ich verwenden muss?

Danke im Voraus.

Bearbeiten: Das Ziel ist es, das Wort aus der Datei in einem Wörterbuch zu speichern und beim Ausdrucken eine aberaţie und nicht 'abera \ xc8 \ x9bie'

zu erhalten

python encoding file decoding representation

lilawood 30.06.2011, 21:21

quelle

1 Antwort

Tags und Links python encoding file decoding representation

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Warum wird% TEMP% in einen nichtdeterministischen Pfad der Form% TEMP \ digit aufgelöst?

score 15 · Accepted Answer

Was versuchst du zu tun?

Dies ist eine Menge von Bytes:

%Vor%

Es ist eine Menge von Bytes, die eine utf-8 -Kodierung der Zeichenfolge "aberaţie" darstellt. Sie decodieren die Bytes, um Ihre Unicode-Zeichenfolge zu erhalten:

%Vor%

Wenn Sie die Unicode-Zeichenfolge in einer Datei speichern möchten, müssen Sie sie in ein bestimmtes Byteformat Ihrer Wahl encodieren:

%Vor%