Ich versuche, eine CSV-Datei mit Python mit dem folgenden Code zu lesen:
%Vor% Mein example.txt
hat nur folgenden Inhalt:
Für UTF-8- oder ANSI-kodierte Dateien gibt dies die erwartete Ausgabe:
%Vor%Aber wenn ich die Datei als UTF-8 mit BOM speichern, bekomme ich diese Ausgabe:
%Vor%Da ich keine Kontrolle darüber habe, welche Dateien der Benutzer als Eingabe verwenden soll, möchte ich, dass dies auch mit BOM funktioniert. Wie kann ich dieses Problem beheben? Muss ich etwas tun, um sicherzustellen, dass dies auch für andere Kodierungen funktioniert?
Sie können das unicodecsv
Python-Modul wie folgt verwenden:
Also für eine Eingabedatei, die folgendes in UTF-8 mit BOM enthält:
%Vor%Es würde Folgendes angezeigt:
%Vor%Tags und Links python character-encoding python-2.7 csv byte-order-mark