Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
Ich würde gerne lernen, wie man Funktionen auf bestimmte Spalten meines Datenrahmens anwendet, ohne die anderen Spalten von meinem df auszuschließen. Zum Beispiel möchte ich einige spezifische Spalten mit 1000 multiplizieren und die anderen so b...
15.11.2012, 13:00
Ich habe den folgenden Code innerhalb einer Funktion
%Vor%
Dies funktioniert, wenn ich versuche, es in R auszuführen, indem ich den Code innerhalb der Funktion auswähle und die Rückgabe auskommentiere. Ich bekomme einen schönen Datenrahmen w...
13.06.2014, 19:37
Ich habe meinen Kopf gegen meinen Schreibtisch geschlagen, kann nicht herausfinden, ob es einen Weg gibt, vielleicht versuche ich etwas Unmögliches.
Ich habe zwei DataFrames mit MultiIndex-Spalten (drei Ebenen) und Zeitindex (einzelne Ebene)....
20.12.2013, 11:31
Gibt es eine schnellere, pythischere Art, dies zu tun?
Was ist?
Diese Warnung wird generiert UserWarning: Boolean Series key will be
reindexed to match DataFrame index. "DataFrame index.", UserWarning
und sollte ich mich darum kümmern?...
22.02.2016, 19:44
Gibt es eine einfache Möglichkeit, Pickle-Dateien (.pkl) aus Pandas Dataframe in R zu lesen?
Eine Möglichkeit besteht darin, nach CSV zu exportieren und R die CSV-Datei lesen zu lassen, aber das erscheint mir sehr umständlich, weil meine Date...
01.02.2016, 00:13
Ich muss eine Matrix mit 80000 Zeilen und 80000 Spalten erstellen. Aber nach dem Lesen von Rbloggern habe ich erfahren, dass die Anzahl der Elemente in einer Matrix 2 ^ 31 - 1 nicht überschreiten kann. Mein Plan, dieses Problem für meinen sp...
06.06.2015, 00:07
Hier mache ich eine neue Spalte, um anzuzeigen, ob myData über oder unter seinem Median liegt
%Vor%
Funktioniert gut. Nun möchte ich dasselbe tun, aber die mittleren Splits innerhalb jeder Ebene von myFactor berechnen.
Ich habe das erfund...
11.08.2009, 11:45
Ich muss eine Tabelle von Teradata (nur Lesezugriff) auf Parkett mit Scala (2.11) / Spark (2.1.0) extrahieren.
Ich baue einen Datenrahmen, den ich erfolgreich laden kann
%Vor%
Aber df.show gibt mir eine NullPointerException:
%Vor%
Ich...
29.08.2017, 08:07
Ich habe folgende Daten:
%Vor%
Die PDF-Datei, aus der Daten extrahiert werden sollen, sieht folgendermaßen aus:
%Vor%
Ich möchte es verarbeiten und eine .csv damit erstellen, damit ich es in einem Datenrahmen speichern und damit an...
16.01.2018, 17:16
Ich habe versucht, die in dieser Frage bereitgestellte Lösung auf meine realen Daten anzuwenden: Auswählen von Zeilen in einem MultiIndexed-Datenrahmen . Irgendwie kann ich nicht die Ergebnisse bekommen, die es geben sollte. Ich habe sowohl den...
07.02.2017, 16:20