dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
3
Antworten

Effiziente Multiplikation von Spalten in einem Datenrahmen

Ich habe einen großen Datenrahmen, in dem ich zwei Spalten multipliziere, um eine weitere Spalte zu erhalten. Zuerst habe ich eine For-Schleife gemacht, so: %Vor% aber das dauert 9 Tage. Eine andere Alternative war plyr, und ich könnte ta...
10.09.2012, 18:40
5
Antworten

Wie kann ich Werte in einem Pandas DataFrame diskretisieren und in eine binäre Matrix konvertieren?

Ich meine so etwas: Ich habe ein DataFrame mit Spalten, die kategorisch oder nominal sein können. Für jede Beobachtung (Zeile) möchte ich eine neue Zeile erzeugen, in der jeder mögliche Wert für die Variablen nun eine eigene binäre Variabl...
29.05.2012, 00:06
6
Antworten

Definieren Sie den Wert einer Spalte in einem Datenrahmen basierend auf 2 Schlüsseln aus einem anderen Datenrahmen

Ich habe folgenden Datenrahmen: %Vor% und ich möchte eine neue Spalte "Wert" basierend auf den Spalten a und b und der Umwandlungstabelle unten erstellen: %Vor% Ich habe versucht, es mit dplyr :: muate ohne viel Erfolg zu tun ... %Vor%...
17.01.2017, 11:49
2
Antworten

Zeilen im Datenrahmen mit Faktor "" entfernen

Ich habe einen Datenrahmen wie x, in dem die Spaltengene ein Faktor sind. Ich möchte alle Zeilen entfernen, in denen Spaltengene nichts haben. In Tabelle X möchte ich Zeile 4 entfernen. Gibt es eine Möglichkeit, dies für einen großen Datenrahmen...
17.08.2011, 08:47
4
Antworten

Erstellen einer neuen Variablen aus einer Nachschlagetabelle

Ich habe die folgenden Spalten in meinem Datensatz: %Vor% Ich möchte eine dritte Spalte "Basen" hinzufügen, die vom Wert des Ergebnisses in Spalte arsesult abhängig ist. Zum Beispiel möchte ich, dass die Basen 1 für eine einzelne, 2 für e...
08.12.2011, 15:39
3
Antworten

Berechnung von Statistiken zu Teilmengen von Daten [duplizieren]

Hier ist ein kleines reproduzierbares Beispiel meiner Daten: %Vor% Ich möchte eine neue Variable generieren, die den Mittelwert von measure für das jeweilige Thema enthält, also: %Vor% Gibt es einen einfachen Weg, dies zu tun, abges...
11.02.2013, 12:47
6
Antworten

Wählen Sie Zeilen innerhalb eines bestimmten Zeitraums aus

Ich habe einen Datenrahmen wie: %Vor% Ich möchte die Zeitrahmen von + -10 Minuten auswählen, wenn Category "1" ist. In diesem Fall, weil category = 1 bei 2013-11-02 08:07:25 AM ist, möchte ich alle Zeilen innerhalb von 07:57:25...
24.06.2015, 22:13
3
Antworten

So öffnen und konvertieren Sie die SQLite-Datenbank in den Pandas-Datenrahmen

Ich habe einige Daten als eine SQLite-Datenbank (data.db) heruntergeladen und ich möchte diese Datenbank in Python öffnen und dann in Pandas Dataframe konvertieren. Dies ist soweit ich getan habe %Vor% Aber es wirft diesen Fehler %Vor%...
16.03.2016, 07:01
5
Antworten

Variablen zu einer Liste zusammenfügen

Leute, Ich bin mit der folgenden Herausforderung ratlos. Ich habe einen Datensatz, der so aussieht: %Vor% Was ich tun möchte, ist, die Daten zu vereinfachen (wenn möglich) und die Variablen "Fruit" und "Amount" zu reduzieren %Vor% Ich...
06.03.2013, 02:40
3
Antworten

Wie finde ich den höchsten Wert in einem Datenrahmen?

Ich habe einen Datenrahmen x mit diesen Werten: %Vor% Eine einfache Frage: Wie erhalte ich den höchsten Wert? (11)     
12.06.2012, 13:13