dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
1
Antwort

Python-Pandas: Wählen Sie Spalten mit allen Null-Einträgen im Dataframe

Wie lautet ein Datenrahmen, um alle Spalten herauszufinden, die nur 0 als Werte haben? %Vor% Erwartete Ausgabe %Vor%     
10.05.2013, 16:28
3
Antworten

So entfernen Sie Zeilen mit inf aus einem Datenrahmen in R

Ich habe einen sehr großen Datenrahmen ( df ) mit ungefähr 35-45 Spalten (Variablen) und Zeilen größer als 300. Einige der Zeilen enthalten NA, NaN, Inf, -Inf Werte in einzelnen oder mehrere Variablen und ich habe benutzt na.omit(df) , um Zei...
13.04.2016, 06:24
2
Antworten

pandas: groupby und aggregieren ohne die Spalte zu verlieren, die gruppiert wurde

Ich habe einen Pandas-Datenrahmen wie unten. Für jede ID kann ich mehrere Namen und Unter-IDs haben. %Vor% Ich möchte den Datenrahmen so zusammenfassen, dass es nur eine Zeile für jede ID gibt und alle Namen und Unter_IDs unter jeder ID als...
11.09.2016, 23:03
2
Antworten

Pandas: Erhöht das Auftreten von Vorkommen in einer Spalte

Ich habe einen DataFrame (df), der eine 'Name' Spalte enthält. In einer Spalte mit der Bezeichnung "Occ_Number" möchte ich eine laufende Liste über die Anzahl der Erscheinungen jedes Wertes in "Name" führen. Zum Beispiel: %Vor% Ich habe v...
19.02.2015, 03:27
2
Antworten

Was macht "df [] -" in R?

Ziemlich einfache Frage, und ich hatte eine schnelle Suche in Google und Stackoverflow. Ich habe das in einem anderen Beitrag gefunden: Aggregiert: Summe nicht sinnvoll für Faktoren . %Vor% Wie funktioniert df[] ?     
16.01.2014, 15:14
1
Antwort

Pandas drop_duplicates - TypeError: Typ Objekt Argument nach * muss eine Sequenz sein, nicht zuordnen

Ich habe meine Frage aktualisiert, um ein klareres Beispiel zu geben. Ist es möglich, die Methode drop_duplicates in Pandas zu verwenden, um doppelte Zeilen basierend auf einer Spalten-ID zu entfernen, in der die Werte eine Liste enthalten. B...
13.06.2016, 14:56
6
Antworten

Wie alle Nicht-NaN-Einträge eines Datenrahmens durch 1 und alle NaN durch 0 ersetzt werden

Ich habe einen Datenrahmen mit 71 Spalten und 30597 Zeilen. Ich möchte alle nicht-nan Einträge durch 1 und die Nan Werte durch 0 ersetzen. Zuerst habe ich for-loop für jeden Wert des Datenrahmens versucht, der zu viel Zeit in Anspruch genomme...
31.05.2016, 10:50
3
Antworten

Zusammenführen und Subtrahieren von Datenrahmenspalten in Pandas?

Ich habe einen Pandas DataFrame, etwas wie: %Vor% Ich möchte zwei Dinge tun: 1) Fügen Sie die Spalten 1 und 2 zusammen: %Vor% Ich habe versucht, .concat zu verwenden, aber das verkettet nur die Zeilen. Scheint nicht so, als könnte ich...
23.04.2015, 19:18
1
Antwort

R extrahiere Datenrahmen aus der Liste ohne Präfixe in Spaltennamen

Ich platziere einen Datenrahmen in der Liste. Wenn Sie dann versuchen, es zurück zu extrahieren - bekomme ich alle Spaltennamen mit dem vorangestellten Listenschlüssel für diesen Datenrahmen, gibt es eine Möglichkeit, den Datenrahmen genau so zu...
24.03.2013, 15:24
2
Antworten

Zählt Zeilen, die keine String-Pandas DataFrames enthalten

Ich möchte die Zeilen zählen, in denen der Datenrahmen keine Zeichenfolge enthält. ZB: %Vor% In dem obigen Datenframe möchte ich die Zeilen zählen, die kein 'u' oder 'z' enthalten. Ich weiß, wie man str.contains verwendet, um die Zeilen mit...
24.07.2013, 14:00