dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
4
Antworten

Wie konvertiert man das gesamte Datenfeld in einen numerischen Wert, während Dezimalzahlen erhalten bleiben?

Ich habe einen gemischten Klassen-Datenrahmen (numerisch und Faktor), wo ich versuche, den gesamten Datenrahmen in numerisch zu konvertieren. Im Folgenden werden die Art der Daten, mit denen ich arbeite, sowie das Problem, dem ich begegne, veran...
15.10.2014, 20:54
5
Antworten

Fügen Sie zwei Datenframes mit ungleichen Zeilen und Spalten hinzu (nicht zusammenführen!)

Ich möchte die Einträge von zwei Datenrahmen effizient summieren, obwohl die Datenrahmen nicht garantiert die gleichen Dimensionen oder Spaltennamen haben. Merge ist nicht das, wonach ich hier bin. Stattdessen möchte ich ein Ausgabeobjekt mit al...
02.02.2016, 20:16
1
Antwort

erhalten erste und letzte Werte in einer groupby

Ich habe einen Datenrahmen df %Vor% Wie bekomme ich die erste und die letzte Zeile, gruppiert nach der ersten Ebene des Indexes? Ich habe es versucht %Vor% und habe %Vor% Das ist so nah dran, was ich will. Wie kann ich den Inde...
05.08.2016, 20:23
1
Antwort

pandas read_table usecols Fehler mit ":"

Ich versuche, einen bestimmten Bereich von nicht-konsekutiven Spalten aus meiner Datei zu lesen, indem ich python pandas read_table-Funktion verwende. Zu diesem Zweck versuche ich: %Vor% Die Idee ist, dass ich versuche, ":" zu verwenden, um...
15.02.2016, 03:03
1
Antwort

Wählen Sie aus Pandas Datenrahmen mit boolescher Reihe / Array

Ich habe einen Datenrahmen: %Vor% und eine boolesche Reihe: %Vor% Wie kann ich mit dem booleschen Array aus dem Datenrahmen auswählen, um ein Ergebnis wie folgt zu erhalten: %Vor%     
21.05.2016, 12:34
5
Antworten

DataFrame-Gleichheit in Apache Spark

Angenommen df1 und df2 sind zwei DataFrame s in Apache Spark, die mit zwei verschiedenen Mechanismen berechnet wurden, z. B. Spark SQL im Vergleich zur Scala / Java / Python-API. Gibt es einen idiomatischen Weg, um zu bestimmen, ob d...
03.07.2015, 02:00
1
Antwort

Richtige Methode zum Testen von NA in Julia DataFrames

Was ist der richtige Weg, um zu testen, ob ein Wert in einem Datenrahmen NA im Julia DataFrames-Paket ist? Ich habe bis jetzt herausgefunden, dass typeof(var) == NAtype funktioniert, aber gibt es einen eleganteren Weg das zu tun?     
26.01.2015, 15:52
1
Antwort

R - Fügt einem Datenrahmen Werte hinzu, die bestimmten Kriterien entsprechen

Ich habe die folgenden zwei Datenrahmen: %Vor% Wie kann ich dem Datenrahmen d, der entsprechende Werte in der Datenrahmenkarte enthält, eine weitere Spalte hinzufügen, die "Übereinstimmung" genannt wird? Der Datenrahmen d sollte also so auss...
21.11.2012, 11:19
2
Antworten

Wie wählt man eine Teilmenge von Werten aus einer benannten Spaltenebene in einem DataFrame aus?

Nehmen wir an, wir haben eine DataFrame mit mehreren Ebenen von Spaltenüberschriften. %Vor% Ich möchte eine Liste von Spalten aus einer benannten Ebene auswählen. %Vor% Methode 1: (veraltet zugunsten von df.loc) %Vor% Das Proble...
06.08.2017, 20:53
1
Antwort

Pandas Rolling Berechnungen für Druckelemente im Fenster

Ich möchte eine Reihe von Werten in einer Spalte eines Pandas-Datenrahmens in einem gleitenden Fenster machen. Zum Beispiel, wenn dies mein Datenrahmen ist %Vor% für eine Fenstergröße von zB 3 möchte ich eine Liste als [111, 111, 110, 100, 0...
20.07.2016, 05:49