Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
Ich versuche, einen Datenrahmen über eine Funktion zu transformieren, die ein Array als Parameter verwendet. Mein Code sieht ungefähr so aus:
%Vor%
Aber beleuchtet Arrays und diese Skriptfehler nicht. Ich habe versucht, eine neue teilweise...
24.06.2015, 20:38
Ich habe einen Datenrahmen in Pandas, und ich möchte einige Statistiken dazu mit R-Funktionen machen. Kein Problem! RPy macht es einfach, einen Datenrahmen von Pandas in R zu senden:
%Vor%
Und wenn wir in IPython sind:
%Vor%
Aus irgendei...
03.05.2015, 08:51
Ich versuche, bei jedem Zeitstempel den Spaltennamen in einem Datenrahmen zu finden, für den der Wert mit dem in einer Zeitreihe zum selben Zeitstempel übereinstimmt.
Hier ist mein Datenrahmen:
%Vor%
Und die Zeitreihe mit Werten, die ich...
06.02.2013, 17:04
Ich versuche, eine zeitraubende for-Schleife zu vermeiden, indem ich ein Aggregat in einem data.frame verwende. Aber ich brauche, dass die Werte einer der Spalten in die endgültige Berechnung eingeht.
%Vor%
Hinweis: Die Funktion ist nur ein...
25.10.2012, 09:47
Woher weiß ich, ob meine Daten in R eine Liste oder ein dat.frame sind?
Wenn ich typeof(x) verwende, heißt das Liste, wenn ich class(x) verwende, heißt es data.frame?
23.07.2016, 08:13
Ich bin sehr neu bei data.table , möchte aber mein Problem damit lösen, da ich das Gefühl habe, es wäre 1000 mal schneller als mit "normalen" data.frames.
Hier ist mein Problem:
Was ich habe:
2 data.tables dt1 und dt2 mögen so...
16.06.2015, 08:35
Die Methode pandas.DataFrame.query() ist von großem Nutzen für das (vor / nach) -Filtern von Daten beim Laden oder Plotten. Es ist besonders praktisch für die Verkettung von Methoden.
Ich möchte oft dieselbe Logik auf eine pandas.Series...
21.10.2016, 08:11
Ich habe einen Datenrahmen, der ungefähr wie folgt aussieht:
%Vor%
und ein anderer Datenrahmen, der ungefähr so aussieht
%Vor%
Was ich tun möchte, ist eine weitere Spalte zum ersten Datenrahmen hinzuzufügen, der boolean Wert ist, ob...
20.04.2015, 12:48
Gibt es eine Möglichkeit, Duplikate (unter Verwendung von drop_duplicates speziell) in einen Pandas-Datenrahmen mit etwa 10 Spalten und 400.000 Zeilen bedingt abzusetzen? Das heißt, ich möchte, dass alle Zeilen, die zwei Spalten enthalten, eine...
03.05.2015, 04:00
Ich möchte zwei Datenrahmen zusammenführen, möchte aber keine Zeilen duplizieren, wenn mehrere Übereinstimmungen vorhanden sind. Stattdessen möchte ich die Beobachtungen an diesem Tag zusammenfassen.
Von? merge: Die Zeilen in den beiden...
12.01.2012, 01:01