dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
4
Antworten

verweben zwei data.frames in R

Ich möchte zwei data.frame in R verweben. Zum Beispiel: %Vor% Ich möchte, dass das Ergebnis wie folgt aussieht: %Vor% erhalten von cbind ing x[1] mit y[1] , x[2] mit y[2] , etc. Was ist der sauberste Weg, dies zu tun?...
09.02.2013, 04:11
4
Antworten

Numpy "wo" mit mehreren Bedingungen

Ich versuche, einem Datenrahmen "df_energy" eine neue Spalte "energy_class" hinzuzufügen, die den String "high" enthält, wenn der Wert "consumption_energy" & gt; 400, "Medium", wenn der Wert "consumption_energy" zwischen 200 und 400 liegt, und "...
23.08.2016, 19:14
5
Antworten

R Schlüssel umwandeln, val-Paar in data.frame

In R habe ich zwei Vektoren von Paaren wie folgt: %Vor% Ich würde das gerne in einen data.frame wie folgt umwandeln: %Vor% Alle Schlüssel, die entweder in x oder y enthalten sind, sollten die Spalten bilden, Schlüssel, die nicht in x ode...
14.11.2011, 20:45
2
Antworten

Wie werden ungültige Zeilen beim Lesen des Datenrahmens aus der Datei in R übersprungen?

Ich habe eine große Datei, die viele Daten enthält, und ich möchte sie in den Dataframe einlesen, habe aber einige ungültige Zeilen gefunden. Diese ungültigen Zeilen bewirken, dass die read.table bricht. Ich versuche die folgende Methode, um ung...
15.05.2012, 10:53
1
Antwort

DataFrame / Dataset groupBy Verhalten / Optimierung

Angenommen, DataFrame df besteht aus den folgenden Spalten:    Name, Nachname, Größe, Breite, Länge, Wiegen Nun möchten wir ein paar Operationen ausführen, zum Beispiel wollen wir ein paar Datenrahmen erstellen, die Daten über Größe un...
02.10.2015, 08:08
2
Antworten

pandas - wie man auf Zellen in Pandas zugreift, äquivalent zu df [3,4] in R

Wie kann ich einfach auf eine Zelle zugreifen, wenn ich ein pandas DataFrame-Objekt habe? Wenn in R angenommen wird, dass mein data.frame df heißt, kann ich mit auf die dritte Zeile und die vierte Spalte zugreifen %Vor% Was ist das Äquivalen...
27.01.2014, 22:58
4
Antworten

Gibt es eine bessere Syntax für die Unterteilung eines Datenrahmens in R?

Ich möchte einen Datenrahmen bedingt ohne referenzieren, der auf den Datenrahmen verweist. Zum Beispiel wenn ich folgendes habe: %Vor% Ich möchte sagen: %Vor% Aber stattdessen muss ich sagen: %Vor% plyr und ggplot behandeln das so...
01.11.2012, 15:00
1
Antwort

Filter Spark DataFrame basiert auf einem anderen Datenrahmen, der Kriterien für die Blacklist angibt

Ich habe eine largeDataFrame (mehrere Spalten und Milliarden von Zeilen) und eine smallDataFrame (einzelne Spalte und 10.000 Zeilen). Ich möchte alle Zeilen aus dem largeDataFrame filtern, wenn die Spalte some_identifier in large...
06.10.2016, 04:27
3
Antworten

Effizienter Weg, einzelne Datenpunkte im Datenrahmen inkrementell zu zählen

Ich versuche einen effizienteren Weg zu finden, um einzigartige Datenpunkte in einem Datenrahmen schrittweise zu zählen. Zum Beispiel habe ich den folgenden Code geschrieben: %Vor% Der Zweck des Codes besteht darin, jede Instanz eines spe...
14.05.2015, 20:10
2
Antworten

Lasse NaNs aus einem pandas dataFrame fallen

Ich verstehe nicht, wie NaNs in Pandas behandelt werden, würde mich freuen, eine Erklärung zu bekommen, weil die Logik für mich "gebrochen" scheint. Ich habe eine CSV-Datei, die mit lesen csv laden. Ich habe eine Spalte "Kommentare" in dieser...
31.07.2013, 12:03