R liest eine tsv-Datei mit einer bestimmten Kodierung

8

Ich versuche, eine .tsv (tab-separated value) Datei in R zu schreiben, indem ich eine bestimmte Kodierung verwende. Es ist angeblich windows-1252 . Und es hat einen Header.

Irgendwelche Vorschläge für den Code, um es in einen Datenrahmen zu setzen?

    
screechOwl 19.03.2012, 03:01
quelle

3 Antworten

19

So etwas vielleicht?

%Vor%     
Tommy 19.03.2012, 04:33
quelle
6

Sie können auch verwenden:

read.delim('thefile.txt', header= T, fileEncoding= "windows-1252")

Geben Sie einfach den Befehl in Ihre R-Konsole ein:

%Vor%

zeigt, dass read.delim ein Befehl für packaged read.table ist, der Tabs bereits als Trennzeichen für Daten definiert. read.delim ist möglicherweise bequemer, wenn Sie mit vielen tsv-Dateien arbeiten.

Der Unterschied zwischen den beiden Befehlen wird ausführlicher besprochen in dieser Stapelfrage .

    
Frederica Stahl 29.05.2013 17:12
quelle
2

df <- read.delim(~/file_directory/file_name.tsv, header = TRUE) funktioniert gut für einzelne .tsv -Datei, weil es bereits tab getrennt ist, also keine Notwendigkeit sep = "\t" . fileEncoding= "windows-1252" könnte verwendet werden, ist aber nicht notwendig.

    
user5462317 16.01.2016 12:00
quelle

Tags und Links