dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
1
Antwort

Übergeben Sie Array als UDF-Parameter in Spark SQL

Ich versuche, einen Datenrahmen über eine Funktion zu transformieren, die ein Array als Parameter verwendet. Mein Code sieht ungefähr so ​​aus: %Vor% Aber beleuchtet Arrays und diese Skriptfehler nicht. Ich habe versucht, eine neue teilweise...
24.06.2015, 20:38
2
Antworten

* Effizient * Verschieben von Datenrahmen von Pandas zu R mit RPy (oder anderen Mitteln)

Ich habe einen Datenrahmen in Pandas, und ich möchte einige Statistiken dazu mit R-Funktionen machen. Kein Problem! RPy macht es einfach, einen Datenrahmen von Pandas in R zu senden: %Vor% Und wenn wir in IPython sind: %Vor% Aus irgendei...
03.05.2015, 08:51
2
Antworten

Hole den Spaltennamen, wo Wert im Pandas-Dataframe ist

Ich versuche, bei jedem Zeitstempel den Spaltennamen in einem Datenrahmen zu finden, für den der Wert mit dem in einer Zeitreihe zum selben Zeitstempel übereinstimmt. Hier ist mein Datenrahmen: %Vor% Und die Zeitreihe mit Werten, die ich...
06.02.2013, 17:04
2
Antworten

R Aggregat mit mehreren Argumenten in Funktion

Ich versuche, eine zeitraubende for-Schleife zu vermeiden, indem ich ein Aggregat in einem data.frame verwende. Aber ich brauche, dass die Werte einer der Spalten in die endgültige Berechnung eingeht. %Vor% Hinweis: Die Funktion ist nur ein...
25.10.2012, 09:47
1
Antwort

Wie kann man feststellen, ob es sich bei den Daten um eine Liste oder ein data.frame in R handelt?

Woher weiß ich, ob meine Daten in R eine Liste oder ein dat.frame sind? Wenn ich typeof(x) verwende, heißt das Liste, wenn ich class(x) verwende, heißt es data.frame?     
23.07.2016, 08:13
1
Antwort

Füllen Sie eine data.table basierend auf dem Wert in einer anderen data.table

Ich bin sehr neu bei data.table , möchte aber mein Problem damit lösen, da ich das Gefühl habe, es wäre 1000 mal schneller als mit "normalen" data.frames. Hier ist mein Problem: Was ich habe: 2 data.tables dt1 und dt2 mögen so...
16.06.2015, 08:35
2
Antworten

Gibt es eine Abfrage-Methode oder ähnliches für Pandas Series (pandas.Series.query ())?

Die Methode pandas.DataFrame.query() ist von großem Nutzen für das (vor / nach) -Filtern von Daten beim Laden oder Plotten. Es ist besonders praktisch für die Verkettung von Methoden. Ich möchte oft dieselbe Logik auf eine pandas.Series...
21.10.2016, 08:11
2
Antworten

R fusionieren basierend auf einer anderen Bedingung als der Gleichheit

Ich habe einen Datenrahmen, der ungefähr wie folgt aussieht: %Vor% und ein anderer Datenrahmen, der ungefähr so ​​aussieht %Vor% Was ich tun möchte, ist eine weitere Spalte zum ersten Datenrahmen hinzuzufügen, der boolean Wert ist, ob...
20.04.2015, 12:48
1
Antwort

Bedingtes Entfernen von Duplikaten Pandas Python

Gibt es eine Möglichkeit, Duplikate (unter Verwendung von drop_duplicates speziell) in einen Pandas-Datenrahmen mit etwa 10 Spalten und 400.000 Zeilen bedingt abzusetzen? Das heißt, ich möchte, dass alle Zeilen, die zwei Spalten enthalten, eine...
03.05.2015, 04:00
1
Antwort

Datenrahmen zusammenführen, ohne Zeilen zu duplizieren

Ich möchte zwei Datenrahmen zusammenführen, möchte aber keine Zeilen duplizieren, wenn mehrere Übereinstimmungen vorhanden sind. Stattdessen möchte ich die Beobachtungen an diesem Tag zusammenfassen.    Von? merge: Die Zeilen in den beiden...
12.01.2012, 01:01