Comma-Separated Values oder Character-Separated Values (CSV) ist ein standardmäßiges "Flat File Database" -Format zum Speichern von Tabellendaten im Klartext, bestehend aus einer optionalen Kopfzeile, die die durch Kommas oder Tabs oder andere begrenzten Tabellenfelder auflistet Trennzeichen, gefolgt von einer oder mehreren Zeilen (durch Zeilentrennung getrennt), die die Tabellensätze als getrennte Listen der Werte darstellen. Newlines und Trennzeichen können in (zitierten) Feldern erscheinen.
Ich versuche, eine .tsv (tab-separated value) Datei in R zu schreiben, indem ich eine bestimmte Kodierung verwende. Es ist angeblich windows-1252 . Und es hat einen Header.
Irgendwelche Vorschläge für den Code, um es in einen Datenrahmen zu...
19.03.2012, 03:01
Ich versuche, große CSV und TSV (Tab getrennt) Dateien mit ca. 1000000 Zeilen oder mehr zu lesen. Jetzt habe ich versucht, ein TSV mit ~2500000 Zeilen mit opencsv zu lesen, aber es wirft mir ein java.lang.NullPointerExceptio...
14.12.2012, 13:52