dataframe

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten verschiedene Variablen sind. Während "data frame" oder "dataframe" für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der in MATLAB und SQL.
1
Antwort

So vermeiden Sie das Schreiben einer row.names-Spalte beim Speichern eines data.frames mit dem xlsx-Paket

Ich habe einen solchen Datenrahmen und möchte die Zeilennamen wirklich entfernen, wenn ich ihn mit dem xlsx-Paket in eine Excel-Datei exportiere. %Vor% Ich habe bereits versucht, den folgenden Befehl zu verwenden, aber er behält sie in der e...
24.08.2012, 22:52
4
Antworten

Aggregiert Daten in einer Spalte basierend auf Werten in einer anderen Spalte

Ich weiß, dass es einen einfachen Weg gibt, dies zu tun ... aber ich kann es nicht herausfinden. Ich habe einen Datenrahmen in meinem R-Skript, der ungefähr so ​​aussieht: %Vor% Beachten Sie, dass A, B und C Spaltennamen sind. Und ich ver...
26.09.2011, 20:03
3
Antworten

Variablen basierend auf dem Namen auswählen (einfacher regulärer Ausdruck)

Ich möchte Variablennamen einbauen, die implizieren, was ich mit ihnen machen soll. Ich stelle mir einen Datenrahmen "Umfrage" vor. %Vor% Nun möchte ich bestimmte Dinge mit allen Variablen tun, die likert enthalten, andere Dinge mit Variab...
09.09.2009, 23:15
4
Antworten

Fügt alle möglichen Diagonalen einer n * n Matrix oder eines Datenrahmens ein

Ich versuche, alle möglichen Zeichen einzufügen, die in einer beliebigen Diagonalen innerhalb einer N * N-Matrix angeordnet sind. Betrachten Sie zum Beispiel die folgende 3 x 3-Matrix: %Vor% In der obigen Matrix muss ich die Diagonalen ei...
04.05.2015, 14:11
5
Antworten

Daten nach Jahr aufteilen

Ich habe Daten wie folgt: %Vor% Ich möchte jetzt die Anzahl der verschiedenen IDs mit einem bestimmten Attribut pro Jahr zählen. Ein Ergebnis könnte so aussehen: %Vor% I der zweite Schritt des Zählens der Vorkommen ist wahrscheinlich...
24.10.2011, 08:10
4
Antworten

Kombiniere zwei Listen in einem Datenrahmen in R

Ich habe zwei Listen mit unterschiedlicher Struktur: %Vor% Ich habe eine Idee, wie man Schleifen verwendet, um beide Listen in einem Datenrahmen zu kombinieren, der wie der folgende aussieht, aber ich bin mir sicher, dass es einen effiziente...
20.02.2015, 13:23
3
Antworten

Effiziente Methode, um Zeilen mit NA-Werten in R zu unterteilen

Hintergrund Bevor ich eine schrittweise Modellauswahl ausführen kann, muss ich fehlende Werte für meine Modellbegriffe entfernen. Mit ein paar Begriffen in meinem Modell gibt es daher ziemlich viele Vektoren, die ich nach NA-Werten suchen muss...
03.12.2013, 03:39
1
Antwort

Beschreiben Sie den gesamten Datenrahmen (alle Spalten) mit Scikit-learn (sklearn), ohne über die Spalten zu iterieren

Ich möchte alle Spalten auf einem Pandas DataFrame imputieren ... die einzige Möglichkeit, dies zu tun, ist Spalte für Spalte, wie unten gezeigt ... Gibt es eine Operation, bei der ich den gesamten DataFrame unterstellen kann, ohne die Spalt...
11.11.2015, 22:12
5
Antworten

Dataframe-Beispiel in Apache spark | Scala

Ich versuche, Proben aus zwei Datenrahmen herauszunehmen, wobei ich das Verhältnis der Anzahl beibehalten muss. zB %Vor% Ich möchte die Daten so abtasten, dass ich 10 Proben der Größe 101 bekomme (1 von df1 und 100 von df2) Jetzt währendd...
24.05.2016, 14:42
4
Antworten

Filtern des Pandas-Datenrahmens mit mehreren booleschen Spalten

Ich versuche, ein df mit mehreren booleschen Variablen zu filtern, die ein Teil des df sind, aber nicht dazu in der Lage waren. Beispieldaten: %Vor% Der dtype für die Spalten C und D ist Boolean. Ich möchte ein neues df (df1) mit nur den...
13.09.2017, 22:06