Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
Wie lautet ein Datenrahmen, um alle Spalten herauszufinden, die nur 0 als Werte haben?
%Vor%
Erwartete Ausgabe
%Vor%
10.05.2013, 16:28
Ich habe einen sehr großen Datenrahmen ( df ) mit ungefähr 35-45 Spalten (Variablen) und Zeilen größer als 300. Einige der Zeilen enthalten NA, NaN, Inf, -Inf Werte in einzelnen oder mehrere Variablen und ich habe benutzt
na.omit(df) , um Zei...
13.04.2016, 06:24
Ich habe einen Pandas-Datenrahmen wie unten. Für jede ID kann ich mehrere Namen und Unter-IDs haben.
%Vor%
Ich möchte den Datenrahmen so zusammenfassen, dass es nur eine Zeile für jede ID gibt und alle Namen und Unter_IDs unter jeder ID als...
11.09.2016, 23:03
Ich habe einen DataFrame (df), der eine 'Name' Spalte enthält. In einer Spalte mit der Bezeichnung "Occ_Number" möchte ich eine laufende Liste über die Anzahl der Erscheinungen jedes Wertes in "Name" führen.
Zum Beispiel:
%Vor%
Ich habe v...
19.02.2015, 03:27
Ziemlich einfache Frage, und ich hatte eine schnelle Suche in Google und Stackoverflow.
Ich habe das in einem anderen Beitrag gefunden: Aggregiert: Summe nicht sinnvoll für Faktoren .
%Vor%
Wie funktioniert df[] ?
16.01.2014, 15:14
Ich habe meine Frage aktualisiert, um ein klareres Beispiel zu geben.
Ist es möglich, die Methode drop_duplicates in Pandas zu verwenden, um doppelte Zeilen basierend auf einer Spalten-ID zu entfernen, in der die Werte eine Liste enthalten. B...
13.06.2016, 14:56
Ich habe einen Datenrahmen mit 71 Spalten und 30597 Zeilen. Ich möchte alle nicht-nan Einträge durch 1 und die Nan Werte durch 0 ersetzen.
Zuerst habe ich for-loop für jeden Wert des Datenrahmens versucht, der zu viel Zeit in Anspruch genomme...
31.05.2016, 10:50
Ich habe einen Pandas DataFrame, etwas wie:
%Vor%
Ich möchte zwei Dinge tun:
1) Fügen Sie die Spalten 1 und 2 zusammen:
%Vor%
Ich habe versucht, .concat zu verwenden, aber das verkettet nur die Zeilen. Scheint nicht so, als könnte ich...
23.04.2015, 19:18
Ich platziere einen Datenrahmen in der Liste. Wenn Sie dann versuchen, es zurück zu extrahieren - bekomme ich alle Spaltennamen mit dem vorangestellten Listenschlüssel für diesen Datenrahmen, gibt es eine Möglichkeit, den Datenrahmen genau so zu...
24.03.2013, 15:24
Ich möchte die Zeilen zählen, in denen der Datenrahmen keine Zeichenfolge enthält. ZB:
%Vor%
In dem obigen Datenframe möchte ich die Zeilen zählen, die kein 'u' oder 'z' enthalten. Ich weiß, wie man str.contains verwendet, um die Zeilen mit...
24.07.2013, 14:00