dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
5
Antworten

Wie findet man das erste lokale Maximum für jede Gruppe?

Angenommen, ich habe einen Pandas-Datenrahmen wie folgt: %Vor% Ich möchte die Zeile mit Parameterwert 3 erhalten. Das ist die Zeile mit dem letzten steigenden Wert vor dem ersten Drop. Beachten Sie, dass wir später höhere Werte haben könnten...
22.10.2017, 05:09
2
Antworten

Ersetze Nullwerte in Spark DataFrame

Ich habe hier eine Lösung gesehen, aber als ich es versuchte, funktioniert es nicht für mich. Zuerst importiere ich eine cars.csv-Datei: %Vor% Was wie folgt aussieht: %Vor% Dann mache ich das: %Vor% Aber die Nullwerte haben sich n...
27.10.2015, 19:10
4
Antworten

Umwandlung von Pandas DataFrame in Orange Table

Ich stelle fest, dass dies schon ein Problem auf GitHub ist . Hat jemand Code, der einen Pandas DataFrame in eine Orange Table konvertiert? Ich habe explizit die folgende Tabelle. %Vor%     
12.10.2014, 00:29
3
Antworten

Halten Sie die gleiche Dummy-Variable in Trainings- und Testdaten

Ich baue ein Vorhersagemodell in Python mit zwei separaten Trainings- und Test-Sets. Die Trainingsdaten enthalten numerische kategoriale Variablen, z. B. Postleitzahl, [91521,23151,12355, ...], und auch string-kategorische Variablen, z. B. city...
26.12.2016, 19:54
2
Antworten

Datenfeld nach Maximalwerten in jeder Gruppe filtern [duplizieren]

Ich habe einen Datenbereich von 180.000 x 400, wobei die Zeilen den Benutzern entsprechen, aber jeder Benutzer genau zwei Zeilen hat. %Vor% Ich möchte die Daten so unterteilen, dass nur die letzte Zeile für jeden Benutzer beibehalten wird...
17.12.2014, 20:29
2
Antworten

Wie setze ich / pandas.DataFrame zu / von Redis?

Nachdem ein DataFrame auf redis gesetzt wurde und dann zurückgeholt wird, gibt redis eine Zeichenfolge zurück und ich kann keinen Weg finden, diese str zu einem DataFrame zu konvertieren. Wie kann ich diese beiden richtig machen?     
21.06.2016, 11:56
3
Antworten

Aufheben der Datenrahmenspalte, die Informationen aus einer anderen Spalte enthält

Ich habe einen Datenrahmen, der aus zwei Spalten besteht: einem Zeichenvektor col1 und einer list Spalte, col2 . %Vor% Ich möchte meine col2 aufheben, wobei ich für jedes Element der Vektoren in der Liste die in col1 gespeicher...
04.10.2014, 15:33
2
Antworten

Vektor vs. Datenrahmen in R

Was ist der Unterschied zwischen einem Vektor und einem Datenrahmen in R? Unter welchen Umständen sollten Vektoren in Datenrahmen konvertiert werden?     
17.02.2010, 11:46
4
Antworten

Wie kann ich alle Zeilen eines Datenrahmens löschen, die eine NA in einer bestimmten Spalte haben?

Was ist der eleganteste Weg, um alle Zeilen in einem Datenrahmen mit einem NA -Wert in einer bestimmten Spalte zu löschen?     
08.01.2015, 16:14
1
Antwort

behandelt Nullen in Pandas DataFrames Spaltenunterteilungen in Python

Was ist der beste Weg, Zero-Nenner zu behandeln, wenn Pandas DataFrame-Spalten in Python voneinander getrennt werden? zum Beispiel: %Vor% Ich möchte, dass die Quoten, bei denen der Nenner Null ist, als NA ( numpy.nan ) registriert werden....
26.04.2013, 19:52